非结构化数据本质上是结构化数据之外的一切数据。非结构化数据具有内部结构,但不通过预定义的数据模型或模式进行结构化。它可能是文本的或非文本的,也可能是人为的或机器生成的。它也可以存储在像NoSQL这样的非关系数据库中。
非结构化数据本身就是噪声。因此,它需要大量的专业知识来突破、梳理和检测模式,然后开发识别这些模式的模型。数据科学家正在积极推动人工智能系统的改进,最大的成功表明人类的本能和经验是必需的。这通常发生在团队专注于非常狭窄的人工智能应用时。
以工作人员的赔偿索赔程序为例,对声明有深入了解的数据科学家团队可以根据他们发现的关键指标创建预测模型。它们包含非结构化数据,如诊断、药物信息、索赔记录等。这样做,人工智能系统评估早期指标,并确定某个索赔可能被拒绝。然后它可以向用户提供警报。索赔代表可以找出如何干预和给予特定索赔更小心,以防止索赔人的律师参与(通常被拒绝的索赔最终涉及律师,这会变得非常昂贵,需要很长时间才能解决)。
在这种情况下,很容易看出人工智能系统是如何为用户提供帮助的,而且当合并非结构化数据时,与单独依赖结构化数据相比,还大大提高了准确性。在非结构化数据(例如,关于共病的信息)中,有一个信息和洞察力的金矿,它无法一致地找到进入结构化数据的方法。每增加一条信息,人工智能系统就会变得更智能,结果也会得到改善。这将提高效率并降低索赔成本。
这只是将非结构化数据合并到企业人工智能系统中的一个好处示例。破解代码需要时间和努力,但回报正在获得前所未有的洞察力——与几天或几周相比,只需几分钟或几小时就可以获得。