python数据挖掘和数据可视化方向

小白级

常用库

  • pandas Pandas 是python的一个数据分析包
  • Numpy 一个用python实现的科学计算包
  • wordcloud 基于Python的词云生成类库
  • jieba(结巴)是一个强大的分词库,完美支持中文分词
  • matplotlib 使用matplotlib能够非常简单的可视化数据
  • Pillow Python平台事实上的图像处理标准库

技术

  • 有自行获取数据的能力(爬虫)
  • 具有一定的数学基础
  • 可以灵活运用工具和搜索引擎
  • 对数据进行统计和分析

书籍

  • Python数据分析与挖掘实战
  • Python网络数据采集
  • 利用Python进行数据分析

学习成果检验

自选任意网站,爬取信息并对数据分析,做出词云或是直方图扇形图类似

入门级


常用库

  • kivy Kivy是一个开源工具包能够让使用相同源代码创建的程序能跨平台运行
  • wxPython wxPython是Python的的GUI图形库,允许开发者很方便的创建GUI用户界面

技术

  • 能够把获取的数据通过在GUI处理并展示

书籍

暂无

学习成果检验

用GUI展示词云(输入需要解析url或是长文本,显示词云)