技術(shù)優(yōu)勢
TECHNICAL
Calin數(shù)據(jù)采集
零拷貝內(nèi)存
應(yīng)用層和驅(qū)動之間進(jìn)行的數(shù)據(jù)交換全部采用零拷貝技術(shù)
讓采集應(yīng)用曾訪問網(wǎng)卡內(nèi)核空間的內(nèi)存,如網(wǎng)卡訪問自己地址空間一樣
沒有系統(tǒng)調(diào)用的上下文切換時間,沒有加鎖開銷
高速網(wǎng)絡(luò)處理
采用自主創(chuàng)新的高性能處理架構(gòu),海量網(wǎng)絡(luò)數(shù)據(jù)包被抓取,優(yōu)先調(diào)度和處理,不丟包、不累計
多核數(shù)據(jù)歸并
每個鏈接的數(shù)據(jù)包按照分發(fā)規(guī)則分發(fā)到不同CPU上進(jìn)行處理
同一個連接、同一個用戶的數(shù)據(jù)包只會分發(fā)到同一個CPU
對用戶和連接資源的處理都是無鎖的高性能內(nèi)存訪問方式
業(yè)務(wù)內(nèi)存保障
把操作系統(tǒng)的內(nèi)存分為了兩部分,一部分由操作系統(tǒng)進(jìn)行管理,另外一部分則構(gòu)成關(guān)鍵業(yè)務(wù)內(nèi)存池
在操作系統(tǒng)層面進(jìn)行隔離,保證業(yè)務(wù)程序有充分內(nèi)存進(jìn)行業(yè)務(wù)處理,保障數(shù)據(jù)包暢通
業(yè)務(wù)深度識別
能利用DPI和DFI技術(shù),對數(shù)據(jù)包解析,識別用戶面數(shù)據(jù)中包含的業(yè)務(wù)類型,并提取相關(guān)元數(shù)據(jù)字段
設(shè)備能夠支持采用定期或是補丁去方式更新業(yè)務(wù)識別能力,持續(xù)跟蹤各種應(yīng)用的發(fā)展和演進(jìn)
Mintaka的大數(shù)據(jù)平臺
Mintaka大數(shù)據(jù)平臺所采用的Hadoop是一個高度可擴(kuò)展的存儲平臺,Hadoop可以存儲和分發(fā)橫跨數(shù)百個并行操作的廉價的服務(wù)器數(shù)據(jù)集群。不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫系統(tǒng)不能擴(kuò)展到處理大量的數(shù)據(jù), Hadoop是能給企業(yè)提供涉及成百上千TB的數(shù)據(jù)節(jié)點上運行的應(yīng)用程序。
Hadoop還為企業(yè)用戶提供了極具成本效益的存儲解決方案。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的問題是,它并不符合海量數(shù)據(jù)的處理器,不能夠符合企業(yè)的成本效益,而且有些商業(yè)數(shù)據(jù)庫使用費用非常昂貴。許多公司不得不假設(shè)那些數(shù)據(jù)最優(yōu)價值,然后根據(jù)這些有價值的數(shù)據(jù)設(shè)定分類,如果保存所有的數(shù)據(jù),那么成本就會過高。雖然這種方法可以短期內(nèi)實現(xiàn)工作,但是隨著數(shù)據(jù)量的增大,這種方式并不能很好的解決問題。Hadoop的架構(gòu)則不同,其版權(quán)使用是免費的,其被設(shè)計為一個向外擴(kuò)展的架構(gòu),可以以一般的x86服務(wù)器集群就提供數(shù)百TB的存儲和計算能力,經(jīng)濟(jì)地存儲所有公司的數(shù)據(jù)供以后使用,節(jié)省的費用是非常驚人的。
Hadoop可以容納移動運營商中的不同類型的數(shù)據(jù),從這些數(shù)據(jù)中產(chǎn)生價值,這意味著移動運營商可以利用Hadoop的靈活性從用戶行為、用戶位置、用戶標(biāo)簽等數(shù)據(jù)中獲得寶貴的商業(yè)價值,并拓展原來的通信業(yè)務(wù)到各種大數(shù)據(jù)運營業(yè)務(wù),與政府及商業(yè)機(jī)構(gòu)開展各種業(yè)務(wù)合作。
海量數(shù)據(jù)的統(tǒng)計分析:Hadoop的架構(gòu)可以以一般的x86服務(wù)器集群就提供數(shù)百TB的存儲和計算能力,其被廣泛應(yīng)用于各大互聯(lián)網(wǎng)公司,包括百度、阿里巴巴及淘寶。
集成Spark Streaming流計算技術(shù),滿足10分鐘實時指標(biāo)統(tǒng)計;集成HBase滿足歷史數(shù)據(jù)及詳單查詢響應(yīng)2秒以內(nèi)。
集群在同時垮掉2個節(jié)點情況下不影響生產(chǎn)。
集群支持在線、橫向擴(kuò)展。
利用MESOS進(jìn)行資源的靈活調(diào)度及計算資源的均衡應(yīng)用,對比于YARN,MESOS可以隔離實時處理模塊及非實時處理模塊的計算資源,以保證實時處理模塊的時效性,避免非實時處理模塊對實時處理模塊的影響。
能規(guī)則引擎支持對于用戶標(biāo)簽智能統(tǒng)計及分析,智能規(guī)則引擎使用Spark MLLib技術(shù),其支持四種常見的機(jī)器學(xué)習(xí)問題:二元分類、回歸聚類以及協(xié)同過濾、同時也包括一個底層的梯度下降優(yōu)化基礎(chǔ)算法來智能地計算用戶標(biāo)簽,以盡可能地精確地為各種業(yè)務(wù)定位目標(biāo)用戶。