4月7日消息,全球领先的商业智能和分析软件供应商SAS公司今天在美国宣布:收购在自然语言处理(NLP)和高级语言技术上处于领先地位的私人公司Teragram。此项并购之举将有助于加强SAS公司自身的文本挖掘 和分析型BI产品线,将范围扩展到企业和移动搜索领域。
早在十多年前,SAS公司就意识到了文本采掘、文本分析以及其他诸如网页、文件、电子邮件、图像和未存储在结构性数据库之中的非结构性数据的重要性,成为为数不多的具有这种前瞻意识的公司之一。如今,SAS仍然在这一重要且不断成长的领域中扮演着领导者的角色。
SAS公司CEO Jim Goodnight先生表示:“Teragram公司的专业技能和NLP技术的引入,将会使整个BI和分析产品的市场格局发生重大改变。Teragram的技术巩固并提升了SAS融合结构性与非结构性数据方面的能力---不仅在我们的文本挖掘解决方案上,而且将嵌入到整个SAS企业智能平台之中---从而更快、更好地找到问题的解决之道。”
Teragram 拥有员工40多人,总部设在马萨诸塞州的剑桥,今后它将成为SAS公司的一部分。这次并购案的详细条款并未公开。Teragram公司所独有的NLP技术已经很成熟,并且拥有一定的客户群,其中包括:CNN、Forbes.com、NYTimes Digital、Sony、WashingtonPost.com、Wolters Kluwer、the World Bank和Yahoo!等公司。
Teragram公司总裁Yves Schabes先生指出:“随着数据爆炸继续呈现发展的趋势,任何企业都需要一种智能的方式对其加以利用,无论这些数据是存储在结构性数据库还是存在于大量非结构性数据源之中。 Teragram以及我们的技术与SAS的分析和文本挖掘技术非常吻合,而且SAS公司仍在不断加大在这一飞速发展领域的开发力度。我们很高兴能够加入到这样一个公司,共同致力于将结构性和非结构性数据进行有机结合的软件事业中,从而帮助用户更好、更快和更准确地进行决策。”
相关资料
自然语言处理
Teragram公司的自然语言处理(NLP)技术将把多种语言和多种来源的文本内容转化为有用的信息,在文字、语言关系和字意层面上实现更加丰富的数据处理功能。Teragram公司已经开发并维护着含有注解的巨大词库,里面包含了数以亿计的词汇,语种多达30多个。
自动分类
Teragram公司先进的分类技术能够依据在企业内部广泛采用的客户标准对文件提供快捷和先进的分类功能,这就使得不论原始文件存放在何处,用户随时能够根据特定的主题更加快速和准确地获得需要的文件,满足特定用户的需求。
自然语言企业搜索
针对企业级的搜索需求,Teragram的NLP技术可以对结构性的企业数据以及非结构性的数据源进行扫描,包括基于文本的报表和网页,以便从这些不同的信息源中获取综合性的答案。
Schabes先生表示:“随着当今企业的国际化发展及员工队伍的分散分布,企业内部的各种系统和格式中所存储的数据的与日俱增,如何快速和准确地找到关键业务问题的解决方案显得比以往任何时候都要重要。而企业级搜索就是充分挖掘企业现有数据源的一个有力武器。SAS商业智能、数据整合及高级分析功能与Teragram公司NLP技术的有机融合,将只需几秒钟的时间就能够针对所搜索的问题提供准确的答案。”
Teragram公司成熟的搜索技术能为企业提供部署和使用BI的轻松环境,从而便于在整个企业内部推广BI的应用。SAS与Teragram技术的相互结合不但可以提供类似报表标题的索引,而且还能够依据实际内容和与之相关的元数据给出必要的索引。
移动搜索
Teragram还为SAS带来了下一代的移动搜索功能,帮助个人实现远程信息的扫描,更加快速地获得答案。采用Teragram的移动搜索技术,人们能够存储和检索信息、连接到诸如BI系统的外部应用、来自BlackBerry的搜索数据库、职能电话或其他移动设备。
非结构性数据中的爆炸
企业管理专家Bill Jensen先生在2001年出版的书籍《Simplicity》中第一次指出了当今信息爆炸的情形。根据他所做的研究以及众多专家的回应,我们看到即使是最为保守的估计,也显示出目前商业信息以每18个月翻一倍的速度增长着。这一数据洪流在近几年当中表现地愈加猛烈,而且这些数据的大部分都存在于传统的、“结构性”数据库之外。根据估算,非结构性数据 占据了各种商业数据的70%,这些非结构性数据主要体现在客户评论和服务日志、电子邮件和聊天记录、文件和调研、博客与RSS资料、质量保修索赔、简历、语音邮件和电话记录以及其他信息源等。
如果业务人员没能在他们的分析报告中囊括进这些非结构性数据---有关客户、市场机会、内部运营、供应链等的内容---那么他们只能算是看到完整画面中的一部分,最终导致决策的失误。像SAS这样的分析功能产品将能够帮助企业编制出结构性和非结构性数据,进而揭示出数据背后的发展动态和趋势,同时利用这些洞察信息进行决策,有效地解决问题,并充分利用各种商机。
SAS: 文本挖掘的先锋
SAS在过去十多年当中始终在所开发的软件中为用户提供着文本挖掘的产品功能,并且于2002年推出了专门针对文本挖掘的产品---SAS Text Miner。
今天,SAS 文本挖掘产品已经被整合到多款面向不同行业需求的解决方案中,包括SAS质量保证分析等产品。像Sub-Zero和上海通用汽车等制造企业采用该解决方案将质保索赔和服务数据等非结构性资料汇总起来,并进行分析,从而及早发现各种潜在的问题,采取及时的处理办法,最终提高了产品质量,改善了客户满意度和忠诚度。
银行用户则利用文本分析进行客户呼叫和相关元数据(如:电话呼叫时长、等候时间、转移次数等)的描述,以便确定客户满意度状况,预测未来的结果(如:该客户是否存在诚信风险或是否有关闭账户的可能性等)。保险公司利用文本分析功能对索赔信息和人口信息进行调整,及早判别出可能的索赔欺诈现象。
SAS及并购举措
当其他软件厂商出于购买客户和市场份额而进行并购的时候,SAS的做法则与众不同。SAS并购其他公司的初衷在于引进某些特定和互补的技术,以便增强和丰富其自身的软件产品,更好地为客户服务。
Goodnight先生说:“我们始终致力于持续发展的、以客户为导向的技术创新工作,而这些创新中的绝大部分都是积极的,出自于我们世界级的研发机构和市场营销的努力。与此同时,我们也一直密切关注着那些对我们能够起到补充作用的先进技术,从而帮助我们满足客户的不同需求。Teragram的NLP技术恰恰符合这样的标准,我们非常高兴有Teragram这样优秀的团队加入到SAS大家庭中来。”
凭借来自SAS的更多资源的支持,Teragram公司现有的客户和OEM合作伙伴也将得到更强大的研发和支持力量。
今天发布的具体信息来自SAS全球论坛,这是规模最大的SAS年度用户大会,有3,000多家SAS软件和解决方案的用户参加了此次大会。 (赛迪网)