Data: 2019-05-17 DONE
-
ItemClassLoader
的settings使用普通get
方法获取具体配置项,以支持dict
类型的settings参数
Date: 2019-05-09
DONE:
- 新增
extract_all_keys
参数,为真值时可直接提取JSON响应的所有字段(可以理解为,extract_keys=*
) - 修复
PEParser._parse_text
bug:在没有parent
参数且响应的json不是JSONArray状况下,支持的解析参数与API标准不一致 - 修复context参数为空时crawled_time字段缺失
-
_parse_start_url
调用时传入不存在的tpl_index_or_id
时抛出异常,而非静默返回None
Date: 2019-04-16
DONE:
-
ItemClassloader
的相关优化:- 增加
load
方法,支持绝对路径的类加载 PEParser
实例化的时候即加载itemname
参数对应的类
- 增加
-
TaskRequest
增加了url
有效性检查。 -
utils
增加了以下方法:is_url(url)
item2dict(item)
抱歉,以前忘记写了。