靈玖軟件:NLPIR語義技術深度挖掘中文信息應用
- 作者:靈玖中科軟件(北京)有限公司 2019-03-07 10:40 950
- 進入店鋪
在線咨詢QQ咨詢
隨著科學技術的發(fā)展,中文信息處理已經(jīng)深入到了社會生活的各方面。廣泛的應用對中文信息處理技術也提出了較高的要求。
中文信息處理是有關中文信息的采集、存儲、傳輸和利用,是指利用電子計算機和現(xiàn)代通信、照明、排版、等自動化技術對漢字信息進行輸入輸出整理、加工、轉(zhuǎn)換、傳輸、復制、等各種處理的一項新興的科學技術。其交叉性使之成為“信息科學”的分支;其綜合性應用使之成為“系統(tǒng)工程”的一個實例。它涉及到語言文字學、計算機科學、信息科學、工程心理學、數(shù)理統(tǒng)計學、聲學、自動識別技術、人工智能、網(wǎng)絡技術、文獻檢索學等等。故可以說它是一門新興的多邊緣科學。
中文信息處理在許多方面有自己的特點。
1、漢字的特殊性
西方語言只有幾十個字母。而漢字由于數(shù)量大且字形復雜,也給計算機處理帶來了困難。漢字信息處理是中文信息處理的關鍵和基礎,包括漢字信息的輸入、漢字信息的加工和漢字信息的輸出等方面,其難點是漢字編碼問題。根據(jù)在漢字信息處理過程中的不同要求,漢字有多種編碼,主要可以分為四類,即漢字輸入編碼,漢字標準編碼,漢字內(nèi)碼和漢字形碼。
2、書面漢語的特殊性
書面漢語中,詞跟記號之間沒有分隔標記,自動分詞成為書面漢語分析的第一道難關。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。在英文的行文中,單詞之間是以空格作為自然分界符的,而中文只是字、句和段可以通過明顯的分界符來簡單劃界,唯獨詞沒有一個形式上的分界符,雖然英文也同樣存在短語的劃分問題,但是在詞這一層上,中文比之英文要復雜的多、困難的多。
3、漢語語音的特殊性
漢語語音的特點是音節(jié)結(jié)構(gòu)簡單,音節(jié)界限分明,但有聲調(diào)和變調(diào)等問題,對于語音識別和語音合成來說,既有有利的一面,?也有不利的一面。
4、漢語語法的特殊性? 漢語形態(tài)貧乏,難以憑借形態(tài)來確定詞的句法功能,詞序和虛詞是主要的語法手段,句法歧義特別復雜,使得漢語語句自動分析這一關鍵技術遲遲不能取得突破。
另外,現(xiàn)有的自然語言處理理論和技術大多都是以英語為研究對象語言發(fā)展起來的。而漢語無論在語音、文字表示,還是在詞匯、語法、語義及其語用等各個層面上,都與之存在著很大的差異。這使得無法直接套用西方已成熟的理論和技術,漢語無疑是計算模型比較不發(fā)達的語言。這對從事中文信息處理的研究者來說是一個巨大的挑戰(zhàn)和壓力。
北京理工大學大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術是滿足大數(shù)據(jù)挖掘?qū)φZ法、詞法和語義的綜合應用。NLPIR大數(shù)據(jù)語義智能分析平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡精準采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內(nèi)容處理的全技術鏈條的共享開發(fā)平臺。
NLPIR大數(shù)據(jù)語義智能分析平臺主要有精準采集、文檔轉(zhuǎn)化、新詞發(fā)現(xiàn)、批量分詞、語言統(tǒng)計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉(zhuǎn)換等十余項功能模塊,平臺提供了客戶端工具,云服務與二次開發(fā)接口等多種產(chǎn)品使用形式。各個中間件API可以無縫地融合到客戶的各類復雜應用系統(tǒng)之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統(tǒng)平臺,可以供Java,Python,C,C#等各類開發(fā)語言使用。
數(shù)據(jù)挖掘技術及其應用是目前國際上的一個研究熱點,并在許多行業(yè)中得到了很好的應用,尤其是在市場營銷中獲得了成功,初步體現(xiàn)了其優(yōu)越性和發(fā)展?jié)摿?。在信息管理領域,綜合應用數(shù)據(jù)挖掘技術和人工智能技術,獲取用戶知識、文獻知識等各類知識,將是實現(xiàn)知識檢索和知識管理發(fā)展的必經(jīng)之路。
靈玖軟件(LING-JOIN-微場景宣傳片),專注于大數(shù)據(jù)語義搜索與挖掘的技術創(chuàng)新與服務,提供大數(shù)據(jù)搜索、大數(shù)據(jù)挖掘與大數(shù)據(jù)應用解決方案,以應對大數(shù)據(jù)的管理、處理、分析,并從大數(shù)據(jù)中獲知識與智慧,將用戶的大數(shù)據(jù)困境轉(zhuǎn)變?yōu)榇髷?shù)據(jù)寶藏。靈玖軟件大數(shù)據(jù)語義技術已經(jīng)應用于全球三十余萬家機構(gòu),靈玖軟件在大數(shù)據(jù)應用落地上有成熟的產(chǎn)品與解決方案,贏得了用戶的一致口碑,政府安全大數(shù)據(jù)已經(jīng)成功應用于中央網(wǎng)信辦、公安部、發(fā)改委、國家統(tǒng)計局、國家氣象局、最高人民法院、解放軍某部在內(nèi)的國家機關,金融大數(shù)據(jù)已經(jīng)服務了央行征信中心、中信信托等頂級金融主管部門;媒體出版大數(shù)據(jù)解決方案被新聞出版廣電總局認可并推廣應用于英大傳媒、北大出版社、農(nóng)業(yè)出版社、人民網(wǎng)、中央電視臺等主流媒體與出版社,企業(yè)大數(shù)據(jù)已經(jīng)成功運營于國家電網(wǎng)、中國郵政、中國電信、華為、海航等知名企業(yè)。
QQ截圖20160727103020.png
靈玖軟件作為大數(shù)據(jù)語義搜索挖掘技術創(chuàng)新的參與者,被首席數(shù)據(jù)官聯(lián)盟評為中國大數(shù)據(jù)自然語言處理方向全國第一名,被新聞出版廣電總局評為出版大數(shù)據(jù)核心技術全國第二名,擁有專利2項,產(chǎn)品認證、著作權十余項,獲得河北省科技成果認定,是國家級高新技術企業(yè)(證書編號:GR201011000707),并通過了ISO9001:2008 GB/T 19001-2008質(zhì)量體系認證(編號為064-12-Q-0296-RO-S)、北京市雙軟認證(編號為京R2010-0240),中關村高新技術企業(yè)(編號為:20102011332101),中國軟件行業(yè)協(xié)會會員。2011入選中小企業(yè)創(chuàng)新基金計劃(編號為11Z075);靈玖團隊入選浙江舟山“千人計劃”;靈玖軟件先后獲得了中央網(wǎng)信辦、河北省科技支撐計劃、新疆自治區(qū)科技支撐計劃等科研攻關項目,是河北科技大學研究生聯(lián)合培養(yǎng)基地,是華為的大數(shù)據(jù)戰(zhàn)略合作伙伴。
靈玖軟件與中國科學院、北京理工大學與新疆大學等知名科研機構(gòu)建有聯(lián)合科研開發(fā)基地,匯聚了國際管理專才與技術專家,靈玖軟件高管胡博士為美籍華裔,是享譽海內(nèi)外的工商管理與金融學專家,擔任美聯(lián)儲高級金融專家,是美國中央銀行的第一位華裔專家,目前在長江商學院擔任兼職教授。靈玖軟件大數(shù)據(jù)挖掘總監(jiān)于博士來自中國科學院,有著10余年大數(shù)據(jù)研究與開發(fā)經(jīng)歷,主持開發(fā)的大數(shù)據(jù)采集挖掘系統(tǒng)廣泛地應用于公安部、中國移動與中國證監(jiān)會等單位;大數(shù)據(jù)搜索處理技術總監(jiān)劉博士畢業(yè)于美國芝加哥大學,曾在全球TREC文本檢索大賽等多項比賽中折冠;并聯(lián)合培訓養(yǎng)了維哈柯等多民族語言處理方面的博士;大數(shù)據(jù)自然語言處理技術總監(jiān)許博士畢業(yè)于日本北海道大學,曾在日本NEC等多家企業(yè)任職十余年,研制的中日機器翻譯以及語音識別技術已經(jīng)投入運營多年。
公司介紹.jpg
靈玖軟件定位:
定位為大數(shù)據(jù)語義搜索挖掘技術服務商,提供大數(shù)據(jù)搜索、大數(shù)據(jù)挖掘與大數(shù)據(jù)管理解決方案,成為大數(shù)據(jù)時代技術與服務的創(chuàng)新引領者。
靈玖軟件價值觀:
從零到九,從無到有, 從平凡到卓越,零缺陷,所以永久。
產(chǎn)品價格:1.00 元/套 起
發(fā)貨地址:北京北京包裝說明:不限
產(chǎn)品數(shù)量:10.00 套產(chǎn)品規(guī)格:不限
信息編號:108536836公司編號:14353682
相關產(chǎn)品:大數(shù)據(jù)開發(fā),大數(shù)據(jù)搜索與挖掘,大數(shù)據(jù)中文分詞
本頁鏈接:http://www.westyellowstonecomfortinn.com/wvs108536836.html
以上信息由企業(yè)自行發(fā)布,該企業(yè)負責信息內(nèi)容的完整性、真實性、準確性和合法性。免費黃頁網(wǎng)對此不承擔任何責任。
馬上查看收錄情況:
百度
360搜索
搜狗