批量抓取百度音乐掌门的歌词文件
May/15th 2010
前段时间心血来潮,想搞个歌词库,于是网上查了一下,发现百度的歌词文件是连续的数字作为文件名(方便啊)。于是就写了个程序批量搞百度的歌词。
程序使用socket方式模拟浏览器去取百度的歌词,速度优化到很快了。 我目前已经下载了百度的91083份歌词啦
百度的歌词文件虽然是数字,但是不是完全连续,中间有些数字是没有歌词的。所以程序显示no的时候,不要觉得奇怪哈。
用法:在命令行下跑。 输入:php baidu.php。 当然,一次肯定是不可能把百度的所有歌词下载下来,所以要分多次。每次下载的起始数字和结尾数字请打开baidu.php编辑。
提醒:下的太快了百度会封你IP。不过过一会就又好了。
5591 read 9 comment(s)
添加新的评论
称呼:*邮件:*
网站:
内容:
不过抓下来的这些歌词,怎么利用呢?
IRC文件怎么读取?
或者怎么利用啊!
望兄弟教我!