雅信时空·帮助中心

时空首页   快速入门   核心技术   热门时空   承包关键词New!  网页收录Hot!  合作推广   常见问题

  1. 精准搜索引擎
  2. 中文语义网
  3. 信息网格
  4. 自然语言理解

 1. 精准搜索引擎

  传统搜索引擎技术早在互联网诞生不久便开始萌芽,并且现已得到广泛应用。但随着互联网规模的爆炸式增长,用户亦逐渐陷入信息的汪洋大海:要想准确搜寻最有价值的目标信息,用户必须耗费越来越多的时间与精力,而且往往不能如愿。现有的搜索引擎虽然能够提供很多方便,但更多的时候却需要用户手工从大量的、杂乱无章的信息中挑出那些少量的、真正有用的东西。雅信搜索作为一种崭新的搜索引擎,其基本目标就是用全新的技术帮助广大互联网用户摆脱庞杂信息的困扰,准确及时地获取所需要的资料。

  雅信致知的基本理念源于“格物致知”这一传统文化的精髓。早在几千年前,中华的先哲们就认为“格物”是一切事业的基础。“雅信致知”中的“信”,即信息、资讯;“雅”则兼有洞悉、分门别类、规整雅致之意。我们认为只有用全新的方法去感悟、收集、整理、提炼瞬息万变的海量互联网信息,信息的急剧增长才能真正产生正面的效应,而不是成为一种负担。雅信搜索通过独特的技术建立庞大的语义化的信息库,为广大用户提供精准的信息搜索以及基于其上的增值业务服务。

  目前,中国雅信核心研发团队历经多年潜心打造的中文精准搜索引擎技术,已处于国际领先水平。
返回页首 

 2. 中文语义网

  当前得到广泛应用的万维网,实质上是一个巨大的存储和共享文本、图像信息的分布式媒介,计算机只是对文字或图像进行展现,其自身无法对内容进行识别理解。因此,目前的万维网存在很大的发展进化空间。从某种意义上来讲,语义网是对万维网本质意义上的变革。

  简单地说,语义网就是基于语义进行逻辑推理和判断的智能网络。理想中的语义网能够在一定程度上理解人类语言和行为规则,使得人与计算机、计算机与计算机之间的顺畅交流理解成为可能。语义网就如一个有机组成的巨型大脑,将万维网中现存的海量级别的信息孤岛,发展凝聚成一个巨大的智能化信息库。

  语义网的最大实际意义在于,对于信息含义的理解不再只有靠人脑才能完成,计算机同样也可以完成这样的工作。例如,当人看到网页上的天气预报信息,很容易理解其中的含义,但计算机并不知道在此天气信息中,哪些代表温度和湿度、哪些是风向和云层信息。而语义网就是要通过特定编码体系,指明哪个数字代表温度,哪个数字代表湿度,并说明“温度”、“湿度”、“风向”等的含义。机器能够理解语义,实质上是对人脑在一定程度上的解放。

  由于中文语义网的架构体系具有对网络空间上所储存数据进行智能分析、评估的能力,这样,计算机就可以像人脑一样“理解”信息的含义,完成“智能代理”的功能。由此而将诞生的语义网搜索引擎,其搜索的结果也将比万维网搜索更精准。

返回页首 

 3. 信息网格

  “网格”与“网络”是不同的概念。网格的目的是要利用互联网将分散在不同地理位置的电脑组织成一台“虚拟的超级计算机”,实现计算资源、存储资源、数据资源、信息资源、软件资源、通信资源、知识资源、专家资源的全面共享。每一台参与的计算机就是一个节点,就像摆放在围棋棋盘上的棋子一样,而棋盘上纵横交错的线条对应于现实世界的网络,所以整个系统就叫网格。在网格上做计算,就像下围棋一样,不是单个棋子完成的,而是所有棋子互相配合形成合力完成的。传统互联网实现了计算机硬件的联通,网格试图实现互联网上所有资源的全面联通。所以说,网格计算是一种高度融合的“协同计算”。在这种环境中,用户可以从中享受一体化的、动态变化的、可灵活控制的、智能的、协作式信息服务。正因为如此,网格技术日益受到关注,目前已经进入科学研究、制造业信息化、电子政务、企业协同、教育信息化、娱乐空间等多种应用领域。

  信息网格的目标是综合系统中所有的信息和能力,提供单一的、集成的、安全的、端到端的信息系统,允许用户访问共享数据和应用程序,而不管他们身在何处。信息网格是要利用现有的网络基础设施、协议规范、Web和数据库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在OS和Web之上的基于Internet的新一代信息平台和软件基础设施。在这个平台上,信息的处理是分布式、协作和智能化的,用户可以通过单一入口访问所有信息。

  采用信息网格技术,提供了一个统一、简便、可扩展的信息网格架构体系。通过该平台,用户能够快速、方便地构建自己的信息网格系统。通过该平台构建的信息网格系统将完全打破信息孤岛的限制,实现跨越站点的信息资源共享和动态管理,建立一体化的信息服务体系。信息网格追求的最终目标是能够做到服务点播和一步到位的服务,雅信科技在此领域的研究已取得重大突破。

返回页首 

 4. 自然语言理解

  自然语言理解是人工智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。研制第五代计算机的主要目标之一,就是要使计算机具有理解和运用自然语言的功能。

  自然语言理解是一门新兴的边缘学科,内容涉及语言学、心理学、逻辑学、声学、数学和计算机科学,而以语言学为基础。自然语言理解的研究,综合应用了现代语音学、音系学语法学、语义学、语用学的知识,同时也向现代语言学提出了一系列的问题和要求。而且,中文自然语言理解比西方自然语言难度更大。

  从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出像人那样理解、分析并回答自然语言。以自然语言理解技术为基础的新一代搜索引擎,被称之为智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。因此,这种搜索引擎具有信息服务的智能化、人性化特征,允许网民采用自然语言进行信息的检索,真正使搜索更方便、更确切。

  由于绝大多数语种使用的是拼音文字,计算机识别拼音字母已无问题,而输入又是按单词分别拼写,因此书面理解一般没有切分音节和单词的问题,只需直接分析词汇、句法和语义。但是汉语用的是汉字,无论是用汉字编码输入还是将来计算机能直接认识汉字,都要首先解决切分单词的问题,因为输入就是一连串汉字,词和词之间没有空隔。书面理解的基本方法是:在计算机里贮存一定的词汇、句法规则、语义规则、推理规则和主题知识。语句输入后,计算机自左至右逐词扫描,根据词典辨认每个单词的词义和用法;根据句法规则确定短语和句子的组合;根据语义规则和推理规则获取输入句的含义;查询知识库,根据主题知识和语句生成规则组织应答输出。目前雅信科技已建成的书面理解系统应用了各种不同的语法理论和分析方法,如生成语法、系统语法、格语法、语义语法等等,都取得了一定的成效。

返回页首 

©2008 Yatio.com  中国雅信