該項目使用了一種名為句子嵌入的簡(jiǎn)單對比學(xué)習(SimCSE)的自然語(yǔ)言處理模型。SimCSE是一個(gè)高性能模型,它創(chuàng )建向量表示*1來(lái)掌握文檔和其他文本的含義。該模型能夠計算不同文本之間的高精度語(yǔ)義相似度,有望在信息檢索和問(wèn)答系統等領(lǐng)域得到應用。
對于這個(gè)項目,兩家公司將基于專(zhuān)利數據庫對SimCSE模型進(jìn)行預培訓,以矢量化專(zhuān)利數據文檔,從而可以高精度地找到類(lèi)似的專(zhuān)利。這些公司已經(jīng)成功地利用張量網(wǎng)絡(luò )*2技術(shù)對SimCSE模型的數據進(jìn)行了高效壓縮。
該模型有望在專(zhuān)利檢索和三井化學(xué)產(chǎn)品新應用的搜索等領(lǐng)域得到實(shí)際應用。
拓展閱讀: