20人加入学习
工作室项目-Python电商平台图片文字中文字识别
价格 免费
抱歉,该课程为限制课程,请联系客服
课程介绍

图片是一种更为生动和形象的视觉表达方式,但也为电子商务网站的管理者带来了技术上的挑战。电商平台对商家发布的商品信息有严格的管理规范,如《京东开放平台禁发商品及信息管理规范》:http://help.jd.com/Vender/viewQuestion-852-2011.html  和《京东开放平台商品标题及广告语发布规范》http://help.jd.com/Vender/viewQuestion-852-2687.html 在这里,我们主要考虑商品信息图片中的文本信息的管理问题:图片中的文本以光学字符的形式表达,不能使用计算机直接检索和处理。

最常见的问题是,商品信息图片中的内容和商品规格参数中的内容不一致。例如某电热水壶产品规格参数中标明材质为“拉丝不锈钢”,而商品信息图片中介绍为304不锈钢。这将造成用户理解上的困扰:到底哪一个是准确的呢?实际上“拉丝”是不锈钢的一种表面处理工艺,“拉丝不锈钢”并没有说明所采用不锈钢材料的成分所符合的国家标准。

商品信息图片可能出现的另一个问题是,采用图片的方式来规避对敏感或违禁词的检测。我国的《广告法》和《反不正当竞争法》分别对虚假广告和利用广告作引人误解的虚假宣传作了禁止性规定。文本形式的商品介绍信息较易进行检测,而使用图片将大大增加电商网站监管的难度和工作量。除了电商网站,微信等社交软件中也存在大量以图像格式存在的文本信息,所以这一问题具有普遍性。

要解决以上的这些问题,需要设计一个系统来自动地从商品信息图片上提取其中的文本信息,这将有助于电子商务企业更好地做出商品推荐、售后服务和信息监管。

授课教师

大数据开发讲师

课程特色

下载资料(2)
作业(10)

学员动态

还没有动态