原谅我这是一个迟到1周的 report。迟到总比不到好 :)
这次陆陆续续来了20多个小伙伴,一个大桌子坐不完只好分散来。而由于投影仪的接口问题,haobug 和一位兄台(忘记名字了,不好意思)去电脑店专门买了 HDMI的转接口,而且是一人买一条,还好有一个可以用。

本次的主题是由dudu带来的对 PyPI 上众多 package 的一个数据分析,他的出发点是想获得一些有用的信息,比如哪些包是活跃开发的,哪些是玩具性的不具备使用价值。如果你想找某一方面的相关包来使用或者来学习,都可以获得一些参考。
具体过程如下:
先是介绍了数据分析的基本概念,本次使用到的 Jupyter 和 Pandas 是什么,Pandas 提供的数据类型(对这个分析起很大作用,简化了操作)。dudu 通过 PyPI 的 API 抓取了几百MB的数据,然后在 Jupyter 下,逐个演示了各个分析过程和结果。例如,最多的命名是以 py 和 dj 开头的,更新最频繁的包是哪些等等。
更新:dudu 上线了他基于这个分析的网站 http://pygarden.com/

dudu 的演示结束之后,问了下在场有没有在 PyPI 上提交过 package 的,很可惜群主没有在,所以大家拿了个零分。然后是提议下一次聚会的主题,大家一时也没有具体的意见。

此次聚会来的主要都是 Python 开发者,部分是自己创业的,还有从事数据分析和 UI 设计方面的妹子,时间匆忙,没有一一交流。最后剩下的几个兄弟一起冒着小雨走到科华路那边吃了个串串+批萨的晚饭。

期待下次的相聚

正在听讲

更多见 QQ 群相册

参考信息
https://jupyter.org/ (Evolved from the IPython Project)

http://pandas.pydata.org/ (Pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.)


Comments

comments powered by Disqus