做“数据科学家版Office”,「DataExa」希望推进AI平民化

1156 字丨阅读本文需 2 分钟

  科技巨头企业,如Alphabet、Facebook、微软、BAT等掌握了海量的数据,笼络了顶尖科学家,拥有更雄厚的资金实力,成为前沿科技底层技术的主要竞技者,对于创业者而言,这是一个“神仙打架”的赛道。

  垂直领域也有数据智能的需求,要将前沿科技落地于垂直行业,存在以下难题:

  ① 需要找到有实效的落地场景;

  ② 即懂业务又懂技术的复合型人才一将难求;

  ③垂直行业的数据源无法打通,“数据孤岛”限制应用;

  尽管有Tensorflow,PyTorch,Theano和Keras等开源的机器学习平台,让AI的开发得以部分去中心化,垂直行业的企业要从0到1开发应用仍然有较高的门槛:需要从数据采集开始,再做数据储存、清洗、挖掘,然后才是机器学习、算法选择与调试、模型评估,最后才是产品发布。

  能不能有一个工具集成的平台,就像Excel之于财会从业者一样,帮数据科学家省去重复性高、技术含量低的环节呢?

  36氪最近接触的DataExa,是一家提供“行业+数据智能”解决方案的科技公司。

  DataExa主要有两款产品,数据洞察平台DataExa-Insight 以及 认知计算平台DataExa-Sati,借用这两个平台,垂直行业的企业要搭建具体场景的模型或者行业图谱时,可以省去从第一行代码到具体与场景结合的前期准备工作。

  DataExa-Insight是一个机器学习和深度学习平台。平台内置了逻辑回归、随机森林、GBDT等40多种常见的机器学习以及100多个神经网络层,包括细化的CNN、RNN、LSTM、RBM等 。算法中参数配置的颗粒度可以做到与微软Azure Machine Learning水平相较的程度。

  在现有算法不适用时,DataExa-Insight也支持技术人员自定义算法,可开放接口,提供SDK做二次开发。创始人兼CEO洪万福表示,目前这些知名厂商的产品都不支持在可视化建模平台上自定义算法 。

  DataExa-Insight的产品开发基于Hadoop、Spark、TensorFlow等开源平台。市场上也有类似的平台,如阿里云的数加PAI、微软的Azure Machine Learning,与之相比,DataExa-Insight的优势在于跳脱了巨头体系的兼容性——使用通用模型格式,可跨行业重复使用,产品复用度高,研发边际成本可以下降。

  另外,大厂商现阶段只支持公有云服务,而DataExa主要提供私有化部署服务。

  DataExa-Insight的另一个亮点在于,支持机器学习和深度学习算法的可视化建模和模板化建模,数据分析师工作过程中可以更专注于如何与场景中的具体问题结合。

  DataExa-Insight的目标还包括数据科学家和不熟悉技术业务分析师。洪万福表示,因为垂直领域的企业大多初步接触数据智能行业,所以即使提供标准化开发平台,仍然需要定制化地为客户开发解决方案,不过行业的最佳实践可以跨行业应用。DatExa-Insight在公安反恐、消费金融风控、精准营销等领域都有最佳实践模型。

  DataExa另一款主打产品是语义计算平台DataExa-Sati,基于自然语言处理、图储存计算、问答系统、推理引擎等技术,挖掘非结构化、半结构化数据,帮助用户建构行业知识图谱的平台。

  DataExa-Sati类似的产品有Spark GraphX、Palantir Gotham、IBM Watson、IBM-i2 Analyze等。相比之下,DataExa-Sati的特点是拥有超过150+功能的图计算引擎,以及类似Wolfram|Alpha的计算推理引擎。

  DataExa-Sati可应用于公共安全情报分析、金融征信、反欺诈、各行业用户画像与精准营销、复杂社交网络图谱等。

  洪万福表示,公安反恐和金融是DataExa应用比较成熟的领域,市场推广方面主要通过与渠道商合作。

  DataExa创始人兼CEO洪万福曾任清华同方软件出口首席架构师、戴尔高级架构师、科宇集团副总裁。团队其他成员还包括微软剑桥研究院博士后、剑桥大学机器智能博士、博士后等。

  DataExa此前曾获得千万级天使投资。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:36氪
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...