Autonomy产品优势精编.docx
- 文档编号:24777032
- 上传时间:2023-06-01
- 格式:DOCX
- 页数:10
- 大小:30.18KB
Autonomy产品优势精编.docx
《Autonomy产品优势精编.docx》由会员分享,可在线阅读,更多相关《Autonomy产品优势精编.docx(10页珍藏版)》请在冰豆网上搜索。
Autonomy产品优势精编
Documentnumber:
WTT-LKK-GBB-08921-EIGG-22986
Autonomy产品优势精编
附件2
Autonomy与同类产品功能对比优势
Autonomy作为非结构化信息处理软件的全球领导厂商,先进的概念分析、模式匹配技术能够使大量的信息之间产生关联,使用户更快地获取信息及其相关信息。
Autonomy的信息处理技术向下兼容,支持所有关键字词、布尔语言的传统搜索技术,独有的算法能够从信息的内容概念上去把握、理解、运用和处理信息,弥补了关键字词技术的不足与大量冗余的缺点。
从国际市场上看,Autonomy已经收购老牌厂商Verity,成为市场占有率第一,并且不断的在扩大市场份额。
众多国际评测机构一致认为,Autonomy的技术已经成为信息处理领域中的领导方向,Autonomy所应用的概念匹配技术也将使信息处理技术产生质的飞跃。
从功能上看,Autonomy相对其他产品的优势包括:
扩展关键词搜索的不足,支持句子、段落搜索,同时完全支持关键字词搜索
相关文档自动关联,与关键词技术的关联不同,采用概念匹配的技术使关联结果更为准确
自动摘要技术,与其他自动摘要技术不同的是(静态抽取段落,不准确),采用概念凝聚分析的技术产生动态摘要,长度可调整,从内容上更具可读性
数据自动采集,支持市面上几乎所有的数据源格式,自动同步数据,自动分类技术,概念分析、模式匹配使得分类更为准确,从内容上去把握分类的结果,而关键字词的技术不能够准确描述分类的定义及分类结果文档的内容
自动聚类技术,同样,使用关键字词不能够产生对文档内容的理解与把握,而Autonomy所擅长的正是理解文档的内容,从内容上实现聚类的目的
自动化信息推送,与关键词定义不同,Autonomy更能通过概念分析得出用户的真正需要,进行个性化的信息推送
社区与协作,通过概念分析出的用户兴趣与爱好,能够在社区中进行交流,这些自动分析功能是关键字词技术所不能够实现的
个人聚焦,自动保存并记忆用户每次搜索获取信息的结果,并可通过训练来分析用户的目的、兴趣与爱好
XML完全支持,开发集成极其简单而高效,使得二次开发周期极短,同时提供市面所有开发工具接口API支持
Autonomy与同类产品的企业级功能对比优势
作为国际厂商,Autonomy在企业级功能上的竞争优势包括:
成熟的连接器使Autonomy能够支持市面上最多的数据源和文档格式,包括200多种数据源支持和300多种文档格式支持;
语言无关性,支持多语言不需要重新构架新系统,更改license和语言设定即可,内核使用Unicode;
海量文档量支持,单引擎支持高达2000万份文档,文档量的海量扩展只需增加引擎作分布式部署即可,使得Autonomy的文档处理量没有上限;
安全权限集成,Autonomy广泛的国际合作,使得Autonomy成为通过国际厂商接口认证(安全)最多的厂商,同时在安全权限集成方面拥有大量的实施经验。
Autonomy同时也是全球唯一能够完美解决LotusNotes数据和权限同时集成的厂商;
系统维护量极低,Autonomy成熟的设计理念使得所有的功能模块都能够自动运行(数据采集/分类/关联/推送/词库维护等),基本上不需要人力的维护,从后期维护的费用上看,Autonomy具有极高的企业应用价值。
跨平台部署与操作,使企业能够节省硬件投资,尽量采用已有的硬件环境。
容灾备份方案,使得企业能够实现7*24小时的高可用软件环境。
负载均衡方案,使得企业具有高速的响应速度,根据应用的需求灵活部署负载均衡,合理利用硬件环境。
高性能支持,可分布式的模块部署使得海量数据的响应速度达到秒级。
测试数据表明,Autonomy在大数据量环境下的性能指标远远超出同类产品。
Autonomy与同类产品技术差异的基本比较
功能
Autonomy
其他厂商
多信息源的支持
Autonomy支持几乎所有企业使用的信息源。
1.Autonomy利用分布式信息获取技术,实现对互联网信息、多媒体以及其它数据信息(各种关系型数据库系统,如:
Oracle、SQLServer、Sybase、DB2等,FTP、FileNet、NNTP等常见文本型存储源;
2.支持各种文本格式(如:
Html、Txt、Doc、Xls、PDF、PPT电子邮件等)的自动实时监控和采集,并采用人工智能处理技术,对采集到的信息进行过滤、自动分类和排重,存储到统一的信息操作处理平台。
其他厂商目前仅支持部分数据源和数据格式。
1.其他厂商不能全面或者完全不支持Notes、Documentum、FileNet、Interwoven等内容管理系统。
2.其他厂商信息采集操作比较复杂,需要先将信息通过网关等导入到其他厂商自带的数据库系统中,此操作不稳定,极易出错。
3.采集后的信息存储在其他厂商自带的数据库中。
其他厂商自带数据库结构落后,性能较差。
全文搜索
1.Autonomy搜索功能包括概念搜索、优化检索、关键词搜索等功能。
2.Autonomy可以为每个用户提供个性化检索服务等功能。
3.Autonomy检索不仅仅局限于对普通文本信息的检索、还包括对图片和多媒体数据的检索
仅支持关键词搜索。
中文切分词
Autonomy采用国内最佳的中文切分词方案海量科技以“砌词”为突破口,巧妙地解决困扰分词最大的问题——未登录词的识别问题,在其他问题上博采众长各个击破,采用复方概念平衡各算法,使海量分词在大规模语料测试中的准确率达到了%,分词效率2000万字/分钟。
正因如此,海量科技承担了2000年度国家863计划课题——“智能信息内容分析方法研究”,并为微软、Autonomy等国际厂商提供全球范围内的中文分词技术。
海量中文智能分词算法特点:
采用了独特的“砌词”算法,变“切”为“砌”有效提高了分词精度和效率,对各种歧义的处理能力大幅度提高。
发展了受限的隐马尔科夫过程,使知识库的冗余大幅降低。
自有中文分词技术,准确率90%以下。
信息自动摘要
1.Autonomy具有基于数据内容中的主要概念进行概括内容摘要的功能
2.根据用户的浏览内容或检索条件,产生变化的动态摘要,使用户能够通过摘要来判断是否打开进行察看,并且能够动态摘要了解信息条目之间的关系。
1.对单篇文章只能生成固定的自动摘要。
无法根据用户的不同专业和兴趣生成特定的摘要。
2.其他厂商自动摘要功能不智能,摘要信息不连贯,甚至无法阅读。
信息自动关联
Autonomy提供信息的自动关联服务。
1.Autonomy的架构可以通过识别文档的主要概念,进而分析信息间的主要关系,从而实现内容间的交叉索引对照。
2.Autonomy可以实时生成超链接,保证立即更新,完全不需要手工将链接插入到内容里面。
当文档被查阅时,这些链接可以自动一次性插入到文档中,因此可以将以前写的文档和文章作为当前文档的参考,档案资料也可以链接到最新的新闻或相关资料。
1.基于矩阵模型的相关文件分析,处理效率和文章大小、文章数量有重大影响。
基本上文章超过10万级别时效率就会很低,对服务器性能和搜索响应都有很大影响。
2.相关文件关联性较差,基本处于概念阶段,少有客户正式使用此功能。
信息自动分类
1.Autonomy能自动对信息进行分类,而且不需要任何手工维护,可以精确地根据文本中的概念进行分类,保证依据内容对所有的数据进行最准确的分类。
2.Autonomy平台的分类技术是一个可完全扩展的解决方案,它能最大限度的处理大量信息并且使其保持一致。
1.使用传统SVM和KNN算法自动分类。
因为算法的先天缺陷,分类效率和效果都不好。
2.当分类树有变更时,如:
增加/修改/删除某个分类节点后,整棵分类树必须重新学习。
自动聚类分析
1.Autonomy自动聚类分析能够自动地分析文本信息内容,根据内容概念来把相似的文档聚类到一起(相关性算法),方便用户分析。
2.完全自动化的生成类别的标题,并支持二维岛图、二维趋势图以及三维立体图的图形化结果展示。
无聚类分析功能。
个性化信息服务
1.Autonomy可实现个性化的信息获取,用户可以利用“个人聚焦”的功能来建立自己感兴趣的内容频道。
2.每个用户的“个人聚焦”都维护着自己的相关性列表,这就实现了不同用户的信息获取需求,而且也能够通过训练机制来提高“个人聚焦”频道中信息的准确度。
无个性化功能。
知识社区与协作
Autonomy通过对用户档案的内容分析和总结,能够自动发现兴趣相同或接近的其他用户,方便用户之间的协作和交流,用户能够快速参考他人训练好的Agent/代理,实现知识经验的便捷传递。
无知识社区和协作功能。
信息自动推送
Autonomy用户服务器存储所有的注册用户个性档案信息,用户服务器可以通过用户浏览的信息内容,分析并总结用户的兴趣爱好,然后进行有目的个性化信息推送服务,支持邮件、网页、短消息等方式的信息推送。
无主动推送功能。
多语言支持
Autonomy特别针对80种以上的语言提供优化支持(包括中文),实现在一套系统之上的多语言检索能力。
其他厂商底层数据库不是Unicode设计,不能直接支持多语言多编码。
目前只支持中英文。
高性能
Autonomy系统的性能变化是线性的,不会像其他系统那样呈现明显下降或不稳定的情况。
在性能要求特别高的环境下,Autonomy支持分布式的部署,可以增加核心引擎IDOL,来做负载均衡,从而提高性能。
其他厂商的业务中心在于内容管理,其全文检索部分的索引库架构已有多年没有更新,性能一般。
高可用性
Autonomy高可用性主要是通过AutonomyDAH(分布式请求服务器)来实现。
DAH能够把来自用户端的检索请求,根据加权预测算法来分布到多个IDOL之上,DAH能够运行在两种模式下:
mirrormode(需要IDOL的多份copy)和non-mirrormode(IDOL中的内容可以相同,也可以不同)。
在这两种模式下,DAH以两种方式来提供系统的高可用性。
其他厂商系统不能保证服务7*24小时不间断运行。
不支持负载均衡和容灾备份。
自动化
Autonomy系统的所有服务器部件经由配置之后都可以完全自动化的运行,完全不需要人工的任何操作。
Autonomy系统的自动化程度非常高,通常由大量人工处理的工作现在都由计算机来完成,从后台的信息抓取、核心功能的实现,到前端用户个性化信息的推送,都实现了完全的自动化。
通过操作系统的任务计划,来实现程序自动化运行。
扩展能力
Autonomy通过分布式的部署来响应对高扩展性方面的需求。
Autonomy系统扩展性非常强,可以在任何有网络连接的地方来部署Autonomy的功能模块。
所有功能模块都支持分布式的配置,相互之间通过Http/XML来进行通讯。
大数据量或大并发用户等企业应用场景下,其他厂商无法直接支持,需要专案定制。
多平台支持
Autonomy支持跨平台的交互操作,可以分布式的部署Autonomy的各个模块在不同的平台之上,例如部署核心引擎在Linux/Unix/Solaris,部署网站连接器在Windows平台上来增加可操作性,部署前端的Portal界面在IBM的服务器上以提高服务质量等等,各个模块之间可以非常紧密地工作在一起。
对多CPU和64bit平台不能充分利用服务器的性能优势。
多元性
Autonomy可以处理几乎所有的非结构化信息格式,可以连接多种应用系统。
如微软Office文档、AdobePDF文档、各种文本文档、网站系统,支持认证的网站连接抓取、各种数据库系统,例如ORACLE,SYBASE,SQL,ACCESS,DB2等等;邮件系统,例如EXCHANGE,POP3,NNTP等等;媒体文件,例如MPEG,AVI,DAT,WAV,RA,ASF,WMA,MP3等等;办公系统,例如LOTUSNOTESOPENTEXT,LIVELINK;HTTPSERVER,FTPSERVER,MOREOVER;各种文件系统,例如NT/UNIX/LINUX/NOVELL文件系统;其他大型应用系统,例如SAP,PEOPLE-SOFT,CRM,ERP,DOCUMENTUM,SIBEL,MICROSOFTSHAREPOINT等等;
支持处理部分数据源和数据格式。
安全集成
AutonomyIDOL支持和第三方的安全认证系统的权限无缝集成。
Autonomy支持SSO单点登陆,即用户以一个用户名和密码登陆到系统后,会同步其它应用系统的用户信息,不用再次输入其它资源的用户名和密码。
主要由用户服务器来实现。
安全性支持差,一般建议客户使用搜索后权限过滤的方式,即搜索出结果后,用户点击标题时再到原始应用中去验证当前用户是否有权访问。
而不能将权限信息映射到索引库中,搜索时就对当前用户权限规则进行过滤。
平台性
Autonomy产品为平台产品,故不局限于某一类应用,即可应用于互联网舆情分析,企业信息门户,企业知识管理。
其他厂商在产品定位上,无法做到试用各种应用的特点,其主要局限于数据库层次上的应用。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Autonomy 产品 优势 精编