-
Notifications
You must be signed in to change notification settings - Fork 196
网易公开课抓取不完整 #24
Comments
Review open_163 |
win下确实可以解析19的video_url(视频有点大,没下下来测试是否能看),但Mac下和Linux下会解析粗来一串‘\x10\x10\x10',所以在此处会引发崩溃,emmm,最近没太多时间,如有急用建议先使用win解析课程链接吧 这节课解析出来的url确实和其他课不一样,是/open-movie/下的视频(其他均为/movie/),但这不应该影响跨平台性,暂时不资到似什么问题,有空再嗦吧:joy:~ |
刚刚对问题进行重新审查了下,发现问题并不是由于什么平台的问题(当然也不应该是),只是我win上默认用了sd清晰度,而当时只是远程的win没考虑到这些 该课程的hd的flv链接确实无法解析,按照主关键字shd、hd、sd以及次关键字mp4、flv的顺序,将会先尝试hd、flv的视频,这刚好是不能解析的那个视频,而使用sd参数后,将会先尝试sd、mp4的视频,这个刚好可以解析,这使得我以为win下可以、Linux不可以……真的好蠢啊 大概地改了下逻辑,当出现无法解析的问题时会自动换模式(清晰度以及格式) |
|
课程链接 |
Ubuntu server测试没任何问题啊…… |
PS C:\Users\47999\Desktop\course-crawler-master> python mooc.py http://open.163.com/special/opencourse/daishu.html During handling of the above exception, another exception occurred: Traceback (most recent call last): |
win不要用Crypto 用pycryptodome…… |
倒数第二句和倒数第三句,我已经打了啊.... |
装卸了N次发现先装 crypto 再装 pycryptodome 会导致 pycryptodome 也不好用,暂时不清楚什么情况,但是可以先把它们全卸掉后重装(只装 pycryptodome )就可以解决 pip uninstall pycryptodome crypto
pip install pycryptodome 我记得当初我使用先安 crypto 后安 pycryptodome 时 |
课程链接:http://open.163.com/special/opencourse/daishu.html
一共35节课,但只抓取前10节,如图
随意选取其他课,也只抓取前10节
后在课程页面按F12自行调查,如图
课程列表里的十节课后面的课要自行展开,右边网页代码也显示前边和后边的课并不是放在一起的,维护者可能忽略了这一点导致课程抓取不完整
还是希望哪位维护者可以抽空改一下,不胜感激.
The text was updated successfully, but these errors were encountered: