开始专注于码农的数据分析
About me

凯捷实习的小小心得

凯捷实习的小小心得
最近没有跟新blog是因为在公司小小的实习还没有适应,以后大概一周会跟新三次的样子,具体内容有: python爬取大街网行业求职信息(百万级) JS前端和jqury框架 深入的python excel处理和管道控件插件模块的编写 可能会有一些关于JAVA入们 原本大三下三月...

SLY 1周前 (06-15) 0评论 0喜欢

BIGGER

python如何将unix时间戳转换为默认时间

python如何将unix时间戳转换为默认时间
0x01 在上一次爬去投资信息的时候解决了这个时间戳转换为默认的事情,在一般网站上很难找到现成的代码,这次我就给大家带来这个转换思路 0x02 我们有的时候爬虫在python上提取到的unix时间戳张这样 1463624764 我们用站长工具来转换一下 我们来看到他给的那个解决...

SLY 1个月前 (05-19) 0评论 1喜欢

BIGGER

简单模拟登陆新浪微博,批量抓取我们想要的数据

简单模拟登陆新浪微博,批量抓取我们想要的数据
0X00 前言 本次需求的产生是由于要帮助中科院九所的女博士做语义分析,需要采集微博 标签为老师的用户一百位,并将它们的微博(至少二十条)保存下来。 0x01 准备工作 原来我在blog上介绍过呆毛亮童鞋他的微博模拟登陆爬取指定用户UID的爬虫   因此先手准备的是如何批量获取用...

SLY 1个月前 (05-18) 0评论 2喜欢

BIGGER

re 正则表达式匹配不到解决方案

re 正则表达式匹配不到解决方案
问题如下: 在正则表达式测试器中测试没有问题,但到了re的python模块中却发现获取为空 如图: 最后发现原因是传入的complile 可能经过了两次转译 正确的写法如下: uid=\\\\”\d{10} 也就是四根\ 忽然想到以前的正则表达式 不由得心中一凉 ...

SLY 1个月前 (05-16) 0评论 1喜欢

BIGGER

Python项下互联网招聘的大数据分析(一万多条)

Python项下互联网招聘的大数据分析(一万多条)
0x00 先上图: 图一:这张图表明招聘C及C++相关频率,至于salary需要除以频数才可以看出他们薪资的不同。 图二:全国对于需求C程序员的集中地方,看来还是北上广独领风烧。 图三:这是python在全国招聘的趋势图。 图四:表示招募python程序员的是那些公司,然...

SLY 1个月前 (05-16) 0评论 3喜欢

东坡突围

百度云最新去SVIP限速版本下载~

百度云最新去SVIP限速版本下载~
前言: 本身自己租用了一个腾讯云服务器windows server服务器(有学生优惠一块钱一个月 比阿里抠门的排队领补助强多了) 然后就想下载某些小片片~ 然后百度云居然在我的100M带宽的服务器上面下载速度才几百K 不对啊 老子是会员 才几百K不是可以加速,后来才发现需要SVI...

SLY 2个月前 (05-08) 0评论 1喜欢

BIGGER

简单写一个草榴的小小爬虫

简单写一个草榴的小小爬虫
先来张图片压压惊~嘿嘿 话说学习爬虫的男淫总是会有些小邪恶的想法 我也不例外,那么本次带来的就是1024 的一个小小爬虫,我后来才发现其实草榴用的网站很老 类似于未名湖BBS 或者早期的DZ一样 几乎是随便爬去 我的思路就是获取第一个板块里面前二十页所有帖子的title和lin...

SLY 2个月前 (05-06) 2评论 1喜欢

BIGGER

简单学习CGI

简单学习CGI
在学习python programing这本书时候,按照书上的例子老是报错有问题 原来写出来运行还蛮好的,真是搞不懂了。所以其中的pickle OOP什么的我就跳过了 反正到时候用MySQL数据库 。。。。 (上完厕所发现好像后面的都可以运行啦) 关于书上讲了本地的CGI如何布置...

SLY 2个月前 (04-24) 0评论 0喜欢