通常情况下,企业文本数据集成完毕以后,都会放置到数据仓库中,才能够和其他的结构化数据进行合并。在这个过程中,需要创建一种全新的查询方式。可以把这种查询称为混合查询(hybrid query),因为该查询不仅针对结构化数据也针对非结构化数据。而由此得到的数据仓库就是一个真正的集成数据仓库,其中包含了结构化和非结构化来源的数据。
客户沟通分析
为了让大家有一个更直观的认识,我们来举一个应用的例子,这个例子对于企业来说只是众多应用方式中的一种——客户沟通分析。我们知道,对于企业来说,接受来自客户的电子邮件是再正常不过的事情。不过,这些电子邮件一旦被读取完毕,往往就会被放置到类似于收件箱的文档当中,和其他成千上完的电子邮件一样散放其中。问题是档企业需要这些沟通电子邮件时,就很难再从这么多的邮件当中将其找出来了。而这对于将来和客户进行进一步的沟通非常重要。
为了更好的进行说明,我们来看一个例子,假设我们有一位客户A,他上个月给公司写了一封措词尖锐的电子邮件,内容是关于他的一份订单被搞砸了。这个月,我们的销售员想要给客户A打电话,想要和他开展更多的业务。所以对于这名销售员来说,重要的是,要知道上个月客户A发来了一封投诉邮件。如果我们想要客户A再购买公司的其他新产品,任何近期的直接沟通联系内容都很重要,不管来自客户的沟通还是主动和客户进行的沟通。那么,企业应当考虑如何查找和过滤相关的电子邮件呢?同样的,企业应当考虑如何查找和过滤不相关的邮件呢?
事实上,如果一旦企业的文本数据已经通过专门用来进行文本集成的集成过程存储到了数据库,这只是非结构化文本数据的很多利用形式之一而已。
IT专家网原创文章,未经许可,严禁转载!
查看原文:http://database.ctocio.com.cn/analysis/26/8068526_1.shtml