在之前的文章中,LUCY和大家介绍了智能投研在自然语言文本、图像数据、舆情数据上的应用。而除了上述几种较为常规的数据之外,AI还可以帮我们获得一些过去不太能够接触到的数据。

随着近十年来各行各业的互联网化发展,爬虫机器人和传感器技术广泛应用,很多领域流量数据的采集成本也逐步降低。

例如传媒和手游行业的媒体播放量,电商、物流、OTA (在线旅游)的商品浏览量和成交量,商铺门店内的用户GPS 定位和WiFi 流量,都能从企业微观经营流量层面来评估企业未来的预期营收情况。

此外,随着近年来政府对于环保等公共事业投入的增加,环保大数据的信息化程度也大大提升,对于各个垂直行业的排污监控已经精细化到每家公司的每个工厂的每个排污口,已经有券商研究所开始利用这些环保类的高频细粒度大数据来评估行业和公司的实际产能和开工率情况。

以造纸行业为例,由于其生产过程中对于大气和水资源的污染极其严重,因此目前国内环保局对于这些排放物的级别污染监控已经细致到各县市的工厂级别,并定期在各省市环保厅网站进行公示。

在传统研究过程中,如果我们仅仅依赖某一方面的数据,对工业产能利用率进行推算,可能会存在较大的误差。

然而在大数据时代,借助机器学习技术和这些不同维度的高频大数据,我们能够从多方面精准判断各家工厂的具体开工率,再结合市场上的商品价格实时走势,轻松推断企业当季大致的盈亏情况。

研究表明,新时代大数据驱动的投资研究工作过程将面临巨大的挑战,一方面数据零散,另一方面数据海量高频,因此人工采集整理的成本都远远高于机器。

不过,目前的自动化流量数据监控能够帮助人类实现的还只是感知智能层面的工作。

未来机器往认知智能方面发展,还需要学会借助各行业的知识图谱,将这些营收和产能的状态数据按照上下游关系完整地串联起来,这样才能模仿人类做投资研究时微观与全局相结合的思维方式。

综上所述,非结构化数据的采集、整理、分析研究、支持投资决策已经不是简单的数据处理,而是需要人工智能技术结合人类专家知识来实现信息的去粗取精。

在下一节,我们就将介绍什么是“知识图谱”,如何利用“知识图谱”,将采集到的大数据进行分析,形成像人一样的独立思维逻辑和判断结论,敬请期待吧。

(来源:浙商基金的财富号 2019-01-25 13:10) [点击查看原文]

追加内容

本文作者可以追加内容哦 !