大數(shù)據(jù)語義分析靈玖LJParser系統(tǒng)升級待發(fā)
- 作者:靈玖中科軟件(北京)有限公司 2017-01-09 15:42 1600
- 進(jìn)入店鋪
在線咨詢QQ咨詢
LJParser網(wǎng)絡(luò)搜索與挖掘系統(tǒng)指的是網(wǎng)絡(luò)搜索、自然語言理解和文本挖掘的技術(shù)開發(fā)的基礎(chǔ)工具集,開發(fā)平臺由多個中間件組成,各個中間件API可以無縫地融合到客戶的各類復(fù)雜應(yīng)用系統(tǒng)之中,可兼容Windows,Linux,F(xiàn)reeBSD等不同操作系統(tǒng),可以供Java,C,C#等各類開發(fā)語言使用。具體中間件包括:
1、漢語詞法分析中間件
漢語詞法分析中間件能對漢語語言進(jìn)行拆分處理,是中文信息處理必備的核心部件。靈玖綜合了各家所長,采用條件隨機(jī)場(Conditional Random Field,簡稱CRF)模型,分詞準(zhǔn)確率接近99%,具備準(zhǔn)確率高、速度快、可適應(yīng)性強(qiáng)等優(yōu)勢;特色功能包括:切分粒度可調(diào)整,融合20余部行業(yè)專有詞典,支持用戶自定義詞典等。
詞性標(biāo)注能對漢語語言進(jìn)行詞性的自動標(biāo)注,它能夠真正理解中文,自動根據(jù)語言環(huán)境將詞語諸如“建設(shè)”標(biāo)注為“名詞”或“動詞”。靈玖采用條件隨機(jī)場(Conditional Random Field,簡稱CRF)模型,一級詞性標(biāo)注準(zhǔn)確率接近99%,具備準(zhǔn)確率高、速度快、可適應(yīng)性強(qiáng)等優(yōu)勢。
2、新語自動發(fā)現(xiàn)中間件
新詞自動發(fā)現(xiàn)技術(shù)能夠識別出詞典中沒有出現(xiàn)過的詞匯、短語、命名實體、流行用語,是語言文獻(xiàn)分析方面的一把利器。新詞發(fā)現(xiàn)脫胎于語言自動分詞技術(shù),又是對分詞技術(shù)的有效提升和補(bǔ)充。
靈玖采用基于語義的統(tǒng)計語言模型,所處理的文檔不受行業(yè)領(lǐng)域限制,能夠有效地挖掘出新出現(xiàn)的特征詞匯,所輸出的詞匯可以配以權(quán)重。
新詞發(fā)現(xiàn)組件可以應(yīng)用于文本挖掘、知識管理、詞典編輯、輿情監(jiān)測等多種應(yīng)用中。
3、文本內(nèi)容去重中間件
文本內(nèi)容去重中間件能夠?qū)ξ谋具M(jìn)行查重處理,同時能找出所有的重復(fù)文件。能夠快速準(zhǔn)確地判斷文件集合或數(shù)據(jù)庫中是否存在相同或相似內(nèi)容的記錄。靈玖采用高效的文章指紋算法,能夠在極短的時間內(nèi)與歷史指紋庫進(jìn)行對比,從而發(fā)現(xiàn)重復(fù)記錄。
4 、文本分類過濾中間件
文本分類中間件能夠根據(jù)文獻(xiàn)內(nèi)容進(jìn)行類別的劃分,可以用于新聞分類、簡歷分類、郵件分類、辦公文檔分類、區(qū)域分類等諸多應(yīng)用。
文本過濾功能能夠從大量文本中快速識別和過濾出符合特殊要求的信息,可應(yīng)用于品牌報道監(jiān)測、垃圾信息屏蔽、敏感信息審查等領(lǐng)域。
靈玖采用基于內(nèi)容的文本自動分類過濾和基于規(guī)則的文本分類過濾兩種方式,并支持兩種方式的混合分類。能夠進(jìn)行多級分類,分類速度每秒100篇以上,平均準(zhǔn)確率90%以上,能夠進(jìn)行中英文分類和中英文的混合分類。用戶可以靈活、方便的更換模板,來實現(xiàn)對不同的主題的分類過濾。
5 、文本聚類中間件
文本聚類是基于相似性算法的自動聚類技術(shù),自動對大量無類別的文檔進(jìn)行歸類,把內(nèi)容相近的文檔歸為一類,并自動為該類生成標(biāo)題和主題詞。適用于自動生成熱點輿論專題、重大新聞事件追蹤、情報的可視化分析等諸多應(yīng)用。
靈玖基于文章集合核心語義理解技術(shù),不僅聚類速度快,而且準(zhǔn)確率高,并能自動得到類別間的演化趨勢。
6 、文檔關(guān)鍵詞提取中間件
文章關(guān)鍵詞提取中間件能夠在全面把握文章的中心思想的基礎(chǔ)上,提取出若干個代表文章語義內(nèi)容的詞匯或短語,相關(guān)結(jié)果可用于精化閱讀、語義查詢和快速匹配等。
采用基于語義的統(tǒng)計語言模型,所處理的文檔不受行業(yè)領(lǐng)域限制,且能夠識別出最新出現(xiàn)的新詞語,所輸出的詞語可以配以權(quán)重。
7、 文本摘要中間件
自動文本摘要中間件能夠?qū)崿F(xiàn)文本內(nèi)容的精簡提煉,從長篇文章中自動提取關(guān)鍵句和關(guān)鍵段落,構(gòu)成摘要內(nèi)容,方便用戶快速瀏覽文本內(nèi)容,提高工作效率。
自動摘要中間件不僅可以針對一篇文檔生成連貫流程的摘要,還能夠?qū)⒕哂邢嗤黝}的多篇文檔去除冗余、并生成一篇簡明扼要的摘要;用戶可以自由設(shè)定摘要的長度、百分比等參數(shù);處理速度達(dá)到每秒鐘20篇。
8 、網(wǎng)頁正文提取中間件
網(wǎng)頁正文提取中間件能夠?qū)崿F(xiàn)HTML格式的精確分析,自動分辨出網(wǎng)頁是屬于索引頁面還是內(nèi)容頁面。對于內(nèi)容頁面,能夠高效剔除HTML標(biāo)簽和導(dǎo)航、廣告等干擾性文字,返回實際有價值的正文內(nèi)容。特別適用于大規(guī)?;ヂ?lián)網(wǎng)信息的高效預(yù)處理和分析。
靈玖基于統(tǒng)計分布規(guī)律模型判定網(wǎng)頁的特征,所適用的網(wǎng)頁不受類型和領(lǐng)域的限制,不需要配置抽取規(guī)則,能夠全自動地對海量互聯(lián)網(wǎng)頁信息進(jìn)行高效處理。
9 、全文搜索中間件
全文搜索中間件內(nèi)核經(jīng)過精心設(shè)計,具有高擴(kuò)展性和高通用性。可支持文本、數(shù)字、日期、字符串等各種數(shù)據(jù)類型的高效索引,支持豐富的查詢語言和查詢類型,支持少數(shù)民族語言的搜索。
同時,全文搜索中間件可以無縫地與現(xiàn)有數(shù)據(jù)庫系統(tǒng)融合,實現(xiàn)全文搜索與相關(guān)的數(shù)據(jù)庫管理應(yīng)用系統(tǒng)。
靈玖軟件(LING-JOIN-微場景宣傳片),專注于大數(shù)據(jù)語義搜索與挖掘的技術(shù)創(chuàng)新與服務(wù),提供大數(shù)據(jù)搜索、大數(shù)據(jù)挖掘與大數(shù)據(jù)應(yīng)用解決方案,以應(yīng)對大數(shù)據(jù)的管理、處理、分析,并從大數(shù)據(jù)中獲知識與智慧,將用戶的大數(shù)據(jù)困境轉(zhuǎn)變?yōu)榇髷?shù)據(jù)寶藏。靈玖軟件大數(shù)據(jù)語義技術(shù)已經(jīng)應(yīng)用于全球三十余萬家機(jī)構(gòu),靈玖軟件在大數(shù)據(jù)應(yīng)用落地上有成熟的產(chǎn)品與解決方案,贏得了用戶的一致口碑,政府安全大數(shù)據(jù)已經(jīng)成功應(yīng)用于中央網(wǎng)信辦、公安部、發(fā)改委、國家統(tǒng)計局、國家氣象局、最高人民法院、解放軍某部在內(nèi)的國家機(jī)關(guān),金融大數(shù)據(jù)已經(jīng)服務(wù)了央行征信中心、中信信托等頂級金融主管部門;媒體出版大數(shù)據(jù)解決方案被新聞出版廣電總局認(rèn)可并推廣應(yīng)用于英大傳媒、北大出版社、農(nóng)業(yè)出版社、人民網(wǎng)、中央電視臺等主流媒體與出版社,企業(yè)大數(shù)據(jù)已經(jīng)成功運(yùn)營于國家電網(wǎng)、中國郵政、中國電信、華為、海航等知名企業(yè)。
QQ截圖20160727103020.png
靈玖軟件作為大數(shù)據(jù)語義搜索挖掘技術(shù)創(chuàng)新的參與者,被首席數(shù)據(jù)官聯(lián)盟評為中國大數(shù)據(jù)自然語言處理方向全國第一名,被新聞出版廣電總局評為出版大數(shù)據(jù)核心技術(shù)全國第二名,擁有專利2項,產(chǎn)品認(rèn)證、著作權(quán)十余項,獲得河北省科技成果認(rèn)定,是國家級高新技術(shù)企業(yè)(證書編號:GR201011000707),并通過了ISO9001:2008 GB/T 19001-2008質(zhì)量體系認(rèn)證(編號為064-12-Q-0296-RO-S)、北京市雙軟認(rèn)證(編號為京R2010-0240),中關(guān)村高新技術(shù)企業(yè)(編號為:20102011332101),中國軟件行業(yè)協(xié)會會員。2011入選中小企業(yè)創(chuàng)新基金計劃(編號為11Z075);靈玖團(tuán)隊入選浙江舟山“千人計劃”;靈玖軟件先后獲得了中央網(wǎng)信辦、河北省科技支撐計劃、新疆自治區(qū)科技支撐計劃等科研攻關(guān)項目,是河北科技大學(xué)研究生聯(lián)合培養(yǎng)基地,是華為的大數(shù)據(jù)戰(zhàn)略合作伙伴。
靈玖軟件與中國科學(xué)院、北京理工大學(xué)與新疆大學(xué)等知名科研機(jī)構(gòu)建有聯(lián)合科研開發(fā)基地,匯聚了國際管理專才與技術(shù)專家,靈玖軟件高管胡博士為美籍華裔,是享譽(yù)海內(nèi)外的工商管理與金融學(xué)專家,擔(dān)任美聯(lián)儲高級金融專家,是美國中央銀行的第一位華裔專家,目前在長江商學(xué)院擔(dān)任兼職教授。靈玖軟件大數(shù)據(jù)挖掘總監(jiān)于博士來自中國科學(xué)院,有著10余年大數(shù)據(jù)研究與開發(fā)經(jīng)歷,主持開發(fā)的大數(shù)據(jù)采集挖掘系統(tǒng)廣泛地應(yīng)用于公安部、中國移動與中國證監(jiān)會等單位;大數(shù)據(jù)搜索處理技術(shù)總監(jiān)劉博士畢業(yè)于美國芝加哥大學(xué),曾在全球TREC文本檢索大賽等多項比賽中折冠;并聯(lián)合培訓(xùn)養(yǎng)了維哈柯等多民族語言處理方面的博士;大數(shù)據(jù)自然語言處理技術(shù)總監(jiān)許博士畢業(yè)于日本北海道大學(xué),曾在日本NEC等多家企業(yè)任職十余年,研制的中日機(jī)器翻譯以及語音識別技術(shù)已經(jīng)投入運(yùn)營多年。
公司介紹.jpg
靈玖軟件定位:
定位為大數(shù)據(jù)語義搜索挖掘技術(shù)服務(wù)商,提供大數(shù)據(jù)搜索、大數(shù)據(jù)挖掘與大數(shù)據(jù)管理解決方案,成為大數(shù)據(jù)時代技術(shù)與服務(wù)的創(chuàng)新引領(lǐng)者。
靈玖軟件價值觀:
從零到九,從無到有, 從平凡到卓越,零缺陷,所以永久。
產(chǎn)品價格:10000.00 元/套 起
發(fā)貨地址:北京北京包裝說明:不限
產(chǎn)品數(shù)量:1.00 套產(chǎn)品規(guī)格:不限
信息編號:68809297公司編號:14353682
相關(guān)產(chǎn)品:大數(shù)據(jù)開發(fā),大數(shù)據(jù)搜索與挖掘,大數(shù)據(jù)中文分詞
本頁鏈接:http://www.westyellowstonecomfortinn.com/wvs68809297.html
以上信息由企業(yè)自行發(fā)布,該企業(yè)負(fù)責(zé)信息內(nèi)容的完整性、真實性、準(zhǔn)確性和合法性。免費黃頁網(wǎng)對此不承擔(dān)任何責(zé)任。
馬上查看收錄情況:
百度
360搜索
搜狗