联系我们
  • 电子邮箱:

    business@idata.cn

  • 客服电话:400-996-7687
  • 点击这里给我发消息客服 点击这里给我发消息客服2
返回顶部

上海二期专题 | 达观数据:中国领先的文本挖掘和搜索、推荐技术服务商

来源 : 微软加速器 发布 : 2017-11-02 11:32:29 访问数 : 263 点赞数 : 9 文章分类 : 科技 查看原文

关键字 : 达观数据 文本数据 技术服务 技术资源 技术团队


项目名称:达观数据

主营业务: 为企业提供文本挖掘、垂直搜索引擎和个性化推荐技术服务

上轮融资:2017年4月获得5000万A轮融资,投资机构为软银赛富、方广资本和众麟资本

下轮融资:2018年将启动B轮融资

项目关键词:人工智能、机器学习、文本挖掘、垂直搜索引擎、自然语言处理


“大数据”目前已经成为全民熟知的热词,但很多人对“大数据”的理解还停留在单纯的数学统计上,比如企业的财务报表,经营状况,APP日活等。

事实上,新闻内容,商品介绍,用户评论,企业内各种各样的合同……它们同样也是数据的一种——文字数据

达观数据的创始人陈运文认为,如果我们用自然语言处理技术很好地处理这些文本数据,挖掘其数据背后的含义,这无疑会给企业的运营和整体效率带来显著的提升。

达观数据创始人兼CEO 陈运文

所谓自然语言处理,就是让计算机能准确理解人类言语的技术。而达观数据,就是一家专注于自然语言处理和深度学习技术研发应用的文本搜索推荐服务商

作为国内唯一一家将智能语义分析同时应用于搜索引擎和推荐引擎搭建的人工智能公司,目前主要为企业提供文本挖掘、垂直搜索和个性化推荐等产品服务。


一个属于人工智能的时代

“我认为,这是一个属于人工智能的时代。”在达观数据CEO陈运文看来,前几十年智能硬件的蓬勃发展给当下如火如荼的人工智能打下了坚实的基础。也正是因为前面大量的数据的积累,让很多企业面对大量的文本数据无从下手

比如达观数据服务的大型传统企业,有大量的文本合同需要审核,公司需要十几个人来处理这项工作。陈运文在走访大型企业的过程中,发现很多企业面对着海量的文本数据,却还在用传统的方式维护。无论是从效率还是准确率上来说,人工的维护方式都存在缺陷和不足。

达观数据为企业提供的服务目前主要集中在三个方面:文本挖掘,个性化推荐引擎和垂直搜索引擎。

人工智能的发展在国内还在起步阶段,除了大型的几家互联网公司有着成熟先进的技术团队,其他无论是中小企业,还是传统行业,在IT技术方面,要么无力承担高昂的技术人力资源成本,要么技术团队对人工智能技术开发实力还有待提升。这也成为了很多企业在发展过程中不可避免的瓶颈。

企业无论是处理海量的文本数据,还是想接入个性化推荐引擎,亦或优化产品的垂直搜索引擎,从而提升用户体验,一旦考虑到技术实力和研发资金投入,大多数企业对当下的领先的技术应用只能望洋兴叹。

做好文本挖掘并非想象那么简单,这背后需要机器理解去理解人类复杂的语言。尤其汉语的语法规则不清晰,表达随意,这些都是机器处理分析时的难点问题。

一方面,需要有强大的算法模型让机器在不同场景中识别文本的含义,另一方面,也要保证持续的学习和泛化能力来提升挖掘的效果。

可见,虽然关于自然语言处理的学术研究已经有五六十年的历史,但文本挖掘想要在企业应用中得到很好的应用效果,需要强大又落地的技术实力支撑。 

达观数据核心技术团队曾任职百度、阿里、腾讯、盛大等一流互联网企业的大数据管理部门,在人工智能技术服务领域已经积累了数十年的经验,并且数次斩获国际顶级技术赛事ACM和EMI的冠军大奖。


技术+服务,打造全方位解决方案

达观数据目前集中的三款产品:文本挖掘,个性化推荐引擎和垂直搜索引擎已经应用到金融、媒体、电商、法律、媒体等多个行业。

每个行业的特点不同,但个性化推荐、垂直搜索这些功能,可以说每个有一定数据积累的公司都需要。

个性化推荐就是根据每个用户的属性和行为偏好,为用户推荐Ta感兴趣的专属内容。对个性化推荐应用,大家所熟悉的是电商、媒体、直播等消费文娱行业,其实,还有我们不曾注意的传统行业。

汽车、法律这些也都是个性化推荐的主要应用领域,尤其是传统法律行业,如果律师在拿到新案件后,可以推荐出与其相关的判例、以往案件和相关法条,无疑对律师行业的整体工作效率都带来显著的提升。 

某大型视频网站接入达观智能推荐后,针对用户行为轨迹数据进行建模,M站提升1.5倍推荐点击率, PC端提高50%推荐点击转化。

大家熟知的谷歌、百度,本身就是一个文字挖掘的人工智能系统。达观专注的垂直搜索引擎则是在某一个平台或网站内的搜索系统

想要确保用户输入关键字就能检索出相关的内容和产品,除了需要系统对文本语义有着深入的理解(即上文提到的自然语言处理技术),还有搜索时间的性能问题,即在用户检索后,用很短的时间呈现出检索结果,而不需要用户等很久才能看到。 

达观专利技术双叠组合算法,多次获得世界算法竞赛冠军

这些用起来简单的功能,实现起来并不简单,一方面,对文本处理要有一定的技术能力,另一方面也需要特殊的数据结构来完成。

某大型女性文学网站,在接入达观搜索系统后,搜索效果显著,搜索结果点击率提升40%,搜索的付费转化增加56%。


给产品运营提供最好用的技术产品

虽然达观数据提供的是技术服务,但真正使用产品服务的往往是公司的产品运营人员,他们需要通过对数据的分析精准洞察用户的真实需求。

大部分产品运营人员擅长的是对行业的理解和洞察,在技术方面并非长项。

达观数据认为,最好的技术服务,不仅仅是提供一流的技术,而是让公司不同的人都能直接可以上手操作,还能够反馈产品一些重要的指标,从而给企业的运营提供数据上的参考建议。

达观数据产品后台,可直接查看运营数据

目前,已经有招商银行、中兴、中国平安、华为、爱卡汽车、暴风影音、丰趣海淘等上百家企业接入了达观数据的产品服务。

今年四月,达观数据完成5000万元A轮融资,由软银赛富领投,方广资本跟投,上轮投资方真格基金、众麟资本等均跟投。预计在2018年开启B轮融资计划。


达观数据 X 微软加速器

达观数据帮助企业深度剖析用户兴趣爱好,自动挖掘数据隐藏的规律,识别文字的语义内容,并进行信息的抓取、搜索、推荐等专业技术服务,同时免去企业开发和维护复杂大数据系统的烦恼,极大地降低生产成本,有效提高企业效益。

这些正是达观数据能够通过层层选拔,顺利进入微软加速器·上海二期的重要原因。

达观联合创始人高翔参加微软加速器Jury Day

自今年8月份加入微软加速器·上海以来,达观数据免费获得价值300万元的Azure云资源。9月,达观数据参了加微软加速器·上海举办的VC Day,与20多家深耕互联网科技的顶级VC对接,拓展了融资资源。

此外,在市场和技术资源等方面也获得了微软加速器的支持与帮助。

10月,达观数据与微软加速器联合举办了开放日活动“用AI技术提升平台运营指标”吸引了100余位数据分析师、产品运营管理者前来交流学习,赢得业内好评。


达观数据关注方式

达观数据 (ID:Datagrand)

点击“阅读原文”进入达观数据官网了解更多


微软加速器·上海

微软加速器•上海在微软、徐汇区政府和上海仪电(集团)的大力推动下,于2017年1月22日正式成立。加速器·上海也成为微软开设在中国的第二家,全球的第八家加速器。微软加速器·上海扎根于中国金融中心——上海,能多方位整合优秀的科技、金融、信息、技术资源,充分发挥上海的地域优势和政策支持,成为华东地区一个卓越的创业基地。由于独特的建立背景,微软加速器·上海致力为入驻企业提供更加全面的加速服务:与徐汇区乃至上海市政府深度互动,和仪电集团为代表的的大型集团、企业深度对接,加快对接效率,加速企业的全面成长,尽快成为行业精英,占据市场高地。


微软加速器旨在做顶尖、专业的创业服务,致力于为中国创新企业提供“人、财、战略、市场拓展”的全方位优质服务。每年在大中华地区进行两期海选,每期选拔15-20家公司,入选的创业公司将入驻4-6个月的国际化办公空间,并得到思想领袖、行业专家及技术专家组成的导师团的扶植与指导;每个入选团队还将得到价值300万人民币的微软Azure云等多种资源,所有资源均为免费的“终身制校友服务”。


2012年7月在中国启动以来,微软加速器连续五年荣获“中国最佳众创空间”称号。截至2017年2月,微软加速器已为140家创业企业成功加速,93%的企业在加速期间获得新一轮融资,企业总估值超过400亿元人民币,估值增长比率600%


微软加速器·上海联系方式:maappsh@microsoft.com