低价卡首屏

老y开网店

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信名称:老y开网店

微 信 号:lakwdian

微信QQ:A8686369

查看: 142|回复: 0

阿里妈妈图像识别刷新世界最好成绩,一年屏蔽4600万恶意推广

[复制链接]

5088

主题

5427

帖子

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
24536
发表于 2016-6-1 13:00:11 | 显示全部楼层 |阅读模式

马上注册,参加淘宝培训。加入培训群:金牌卖家淘宝学院2班

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
日前,阿里母亲图画团队的OCR(图中文字辨认)技能改写了ICDAR Robust Reading竞赛数据集的全球最佳成果,并大幅逾越第二名。Robust Reading竞赛是当时OCR技能范畴全球最具影响力的竞赛。这也是继阿里巴巴图画搜索领军人物华先胜取得ACM(美国核算机协会)“出色科学家”称谓往后,阿里的图画辨认技能再一次登上世界顶尖舞台。

20160601tu0ol0zbacc.jpg

20160601tu0ol0zbacc.jpg

图. ICDAR Robust Reading Challenge 1 end-to-end官方成果

  凭借这一抢先的OCR技能,阿里母亲图画团队可以以95%的超高准确率辨认图中违规文字信息,有用过滤商家歹意推行,维护花费者权益。2015年,阿里母亲累计屏蔽了4600万条歹意推行。
  OCR是核算机视觉范畴的经典疑问,长久以来,一向遭到学术界和工业界的继续注重。在工业界,Google、Microsoft、Amazon等大型互联网公司,以及商汤科技、旷视科技(具有Face++、Image++)等核算机视觉技能创业公司,都在OCR技能上耕耘多年。跟着技能不断老练,OCR也开端在互联网及别的职业逐渐上线运用。
  据阿里母亲定向算法技能负责人盖坤介绍,在阿里巴巴平台上推行构思、产品等均是以图画办法展现,图画技能是了解这些信息的首要手法。同时,也有不良商家在图画中内嵌一些违规的信息到达其歹意推行的意图,图画内文字违规是份额相当大的一类,而传统监控手法多以人工肉眼来审阅,费时吃力,尤其是跟着图画数量越来越大,这简直已变成不行完结的使命。关于这一激烈需要,从2014年开端,阿里母亲图画团队开端要害攻坚OCR技能,通过机器视觉的办法从图画中辨认出文字,然后鉴别出违规的案牍信息。
  对歹意推行的界说,盖坤表明,一方面依据国家有关法令法规,关于违禁品、色情信息、封建迷信、假冒伪劣、瘦身丰乳、夸张虚伪等违规类型进行不一样程度的处分和处理,另一方面在法规以外平台有着更高请求,对损害花费者利益或进行不正当竞赛的推行类型活跃测验进行管控。其间,与花费者联络最为亲近的假冒伪劣单项违规类型,被阿里母亲作为要害检查方针。
  相对别的约束场景OCR运用比较,阿里母亲要处理的构思图画和产品图画上的文字字体、颜色愈加多样,文字方案愈加灵敏,布景包含各种产品、布景或天然场景,包含各种杂乱纹路,给辨认疑问带来了更大的应战。盖坤介绍,在技能路线上,比较于传统办法,扔掉了图画预处理、字符切割等流程,采用了多个深度神经网络和言语模型相联系的办法来构成完好的OCR体系。关于杂乱的场景信息,将LSTM(长短时记忆)技能成功运用到建模中去,大大提高辨认的准确率。
  据悉,如今依据OCR文字辨认实时审阅已掩盖悉数阿里母亲事务,天天处理图画近千万张,自动反应疑似违规图画准确率达95%以上;同时将图文审阅危险发现时刻从“天”下降到“秒”级。数据显现,2015年阿里母亲累计屏蔽了4600万条歹意推行,有用净化了互联网推行环境。
  除OCR过滤歹意推行以外,核算机视觉技能在阿里巴巴集团内部现已取得广泛运用,比方手淘的“拍立淘”产品,通过手机摄影即可搜索类似产品,2015年双11当天,千万花费者运用了“拍立淘”功用,发明了逾越数千万元的出售额。别的,在产品图画版权维护、鉴黄等场景也都引入了核算机视觉技能。



上一篇:快递实名今日实施 信息漏洞有隐忧
下一篇:阿里旅行牵手长隆集团,游未来景区即使身无分文也不怕
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

老y推荐上一条 /1 下一条

快速回复 返回顶部 返回列表