獲取語言數據提供程序Datamundi摘要
2021年12月15日,波蘭總部成立語言服務提供商 語言峰會宣布收購比利時語言數據提供商Datamundi。
Datamundi向NLP系統構建者提供所有語言的語言數據,NLP系統構建者使用這些數據來創建和增強其機器翻譯(MT)引擎或優化搜索相關性。它的客戶群以被稱為“FAMGA”的大型科技集團為中心,Facebook、蘋果、微軟、谷歌和亞馬遜。
語言CEO峰會 克里斯托夫·茲達諾夫斯基告訴Slator,Datamundi在出售前由Gert Van Assche(管理合伙人)和他的妻子所有。他說:“Datamundi在2021年早些時候與我們聯系,當時他們決定啟動退出程序”,“我們的報價已被選為中標人?!?。
這筆交易將使Summa Linguae為Datamundi支付500萬歐元(570萬美元),或收入的2.5倍。收購資金來自Summa Linguae自有資金——150萬歐元股票和350萬歐元現金。
Summa Linguae創收 2020年8850萬茲羅提(2370萬美元),較2019年增長13.2%。Datamundi的收入減少了好幾倍,為200萬歐元(230萬美元)。斯萊托公司的首席執行官表示,盡管在2021年,該公司的年收入增長率保持在40%,而在2021年,該公司的年收入增長率保持在50%。
根據Zdanowski的說法,Datamundi將被整合到Summa Linguae的品牌之下,“2021年的預計合并收入在2600萬至2700萬美元之間?!盨umma Linguae的目標是在2022年實現15-20%的增長,與往年保持一致。
Van Assche是一位行業資深人士,他將加入Summa Linguae擔任CTO,而Datamundi的經理、開發人員、數據科學家和程序經理也將留任。
聲音、圖像、語言
在Datamundi與Summa Linguae取得聯系之前,兩人之前沒有任何關系,但彼此都認識,因為他們的客戶組合中有一個共享客戶,他們為他們提供了不同的服務。
Zdanowski解釋了收購背后的理由,他說“Datamundi很好地補充了我們的數據解決方案組合?!眘ummalinguae以前專注于語音和圖像數據,而Datamundi的唯一關注點是語言數據。
自2017年以來,Summa Linguae一直將其戰略重點轉向數據解決方案,數據解決方案已成為業務中越來越重要的一部分。Zdanowski將收購Datamundi形容為“這條道路上的又一個里程碑”,并表示Datamundi專注于FAMGA客戶群,這與該公司為全球大型客戶提供服務的戰略完全一致。
收購加拿大總部2019年數據注釋公司Globalme,Summa Linguae已經增加了其數據服務能力,通過Globalme交易獲得了數據收集服務、后處理平臺、專有項目和工作流工具以及自動化技術。
在Summa Lingae的并購路線圖上,Zdanowski表示,“考慮到我們股權結構的性質(Summa的多數股權歸PE所有),我們不能排除在2022年進行另一次收購。鈥 他補充道,鈥渨我們一直在尋找優秀的公司來補充我們的投資組合。鈥
據首席執行官說,在收購Datamundi之后,鈥渙超過70%的舌尖鈥檚 收入將來自非本地化工作,幾乎全部來自美國客戶。鈥
數據解決方案需求
Datamundi在語言數據方面的經驗非常豐富。同時,科學家們還引入了人工數據的標注、自動數據對齊和數據過濾、數據標注和版本調整。
Zdanowski表示,對Datamundi的需求鈥檚 服務包括數據標記、人工翻譯和機器翻譯輸出質量評估,以及自動數據對齊和標記鈥渙只是在成長。鈥
Datamundi有一個內部使用的數據注釋平臺。它沒有獲得外部許可,但可以在自助服務的基礎上提供給客戶。該平臺作為一個生產環境來支持項目管理和自由職業者的任務。
盡管該平臺包含許多自動化功能鈥 比如一個人工智能工具來檢測網站上的色情內容,模式檢測,以及一個對齊工具鈥 Zdanowski說,這個平臺主要是為人類注釋者設計的,他還補充說鈥渦ses一系列技術來檢測潛在的欺詐行為和QA自由職業者鈥 輸出。鈥
指出任務如何鈥渂同時也是非常專業的,鈥 Summa Linguae首席執行官說,鈥渃留置權遠遠超過了前10名鈥 15種語言,并在其他語言中構建更多的NLP技術,包括利基語言,這給我們帶來了額外的挑戰和機遇。鈥
Summa Linguae在交易中由CK Legal Chabasiewicz、Kowalska i Partnerzy(波蘭)和Novius(比利時)擔任顧問。