協助賣糕人正常對話的工具
- 語義搜尋不用配對關鍵詞字符的方式,而是根據關鍵詞的意思作搜索,支援不同用詞,甚至跨語言的搜索
- 例如:搜尋「so what」就可以找到愛音「那又怎樣?」的圖
-
建立,啓動虛擬環境
python3 -m venv venv
source venv/bin/activate
-
安裝依賴
pip install -r requirements.txt
在資料集建立過程中,該工具使用一個預訓練的文本嵌入模型,將標註集合轉換為歐幾里得空間中的向量。當提交查詢時,該查詢被轉換為一個向量,並使用餘弦相似度來找到資料集中與其最相似的k個條目。
具體地說,對於嵌入在
由於在歐幾里得空間中點積的對偶性,餘弦相似度等價於向量
搜尋的優化是透過將資料集打包到一個特徵矩陣