计划目标:完成一个全模拟人操作的爬虫项目以及相应的数据分析
当前进展:
模拟任务
模拟浏览器截图 完成
模拟鼠标点击 完成
OCR项目
字体导入 完成
汉字训练集图片生成+汉字位置生成 未完成
英文训练集图片生成+位置生成 未完成
英汉目标检测训练(yolo3) 未完成
聚类分行 未完成
分词入库 未完成
图像目标检测项目
图像检测 未完成
图像文本关联 未完成
图像保存 未完成
图像语义分割 未完成
图像分类训练 未完成
图像+文本 搜索项目
特征工程 未完成
词汇树 未完成
散列算法 未完成
同时间多维度分析项目
图像训练 未完成
文本训练 未完成
图像文本关联训练 未完成
时序分析项目
文本图像关联训练 未完成
数据可视化 未完成
OCR完成之后会开源到github,欢迎有兴趣的一起参加
记录于 2018年4月18日夜
领取专属 10元无门槛券
私享最新 技术干货