推薦語(yǔ):Redis Copilot全新上線,助力開(kāi)發(fā)者更加高效地使用Redis構(gòu)建應(yīng)用,智能化解決開(kāi)發(fā)難題,快來(lái)體驗(yàn)!
摘要:Redis Copilot是一款全新的人工智能助手,旨在幫助開(kāi)發(fā)者更高效地使用Redis構(gòu)建應(yīng)用。通過(guò)提供專業(yè)解答、生成代碼片段和執(zhí)行查詢,Redis Copilot提升了開(kāi)發(fā)者的工作效率,特別是在人工智能應(yīng)用的構(gòu)建和部署中。結(jié)合RAG方法和實(shí)時(shí)向量數(shù)據(jù)庫(kù),Redis Copilot確保開(kāi)發(fā)者能快速獲取最新的相關(guān)信息。
我們最近發(fā)布了 Redis Copilot,旨在幫助開(kāi)發(fā)者更加高效地使用 Redis 構(gòu)建應(yīng)用。提升應(yīng)用性能,簡(jiǎn)化構(gòu)建過(guò)程是我們不懈的追求。Redis Copilot 正是為此而生的人工智能助手,助力開(kāi)發(fā)者迅速掌握 Redis 的使用技巧。現(xiàn)在您可以在 Redis Insight 中開(kāi)始體驗(yàn)它的強(qiáng)大功能。
Redis Copilot 能夠幫助您:
- 根據(jù)最新的 Redis 文檔,為您提供專業(yè)解答;
- 生成實(shí)用代碼片段,加速 Redis 應(yīng)用開(kāi)發(fā);
- 通過(guò)在 Redis 中生成并執(zhí)行查詢來(lái)回答關(guān)于數(shù)據(jù)的問(wèn)題。
Redis Copilot 的人工智能特性
Redis 致力于提升應(yīng)用程序的速度。
在開(kāi)發(fā) Redis Copilot 的過(guò)程中,我們深知其需要提供迅速且準(zhǔn)確的回答,并具備全球范圍內(nèi)的可用性。因此,我們利用 Redis 的強(qiáng)大功能打造了 Redis Copilot,以提供卓越的用戶體驗(yàn),滿足開(kāi)發(fā)者對(duì)于 Redis 驅(qū)動(dòng)應(yīng)用的期待。
我們提供了多種專門(mén)用于構(gòu)建人工智能應(yīng)用的組件,同時(shí)也分享了許多客戶如何在其人工智能應(yīng)用中高效使用 Redis 的經(jīng)驗(yàn)。以下我們將詳細(xì)介紹如何借助 Redis 加速您的應(yīng)用。
利用最快的向量數(shù)據(jù)庫(kù)驅(qū)動(dòng) RAG 方法以獲得更優(yōu)答案
Meta 在 2020 年提出了 RAG 方法,該方法允許大型語(yǔ)言模型(LLM)通過(guò)檢索機(jī)制整合外部知識(shí)源,從而利用最新信息擴(kuò)展其能力。這使得語(yǔ)言模型能夠?qū)崟r(shí)提供更精確的答案。
實(shí)踐證明,RAG 效果顯著,但它需要精細(xì)的提示工程、全新的知識(shí)管理和協(xié)調(diào)不同組件的能力。作為一款實(shí)時(shí)向量數(shù)據(jù)庫(kù),Redis 能夠?qū)崟r(shí)搜索數(shù)百萬(wàn)個(gè)嵌入向量,確保根據(jù)用戶的提示提供相關(guān)上下文信息。
Redis Copilot 利用 RAG 方法和我們的向量數(shù)據(jù)庫(kù),從文檔中檢索相關(guān)信息,以幫助回答問(wèn)題。在我們的基準(zhǔn)測(cè)試中,Redis Copilot 展現(xiàn)出了最快的速度。由于采用了 RAG 方法,Redis Copilot 能夠始終提供最新的 Redis 相關(guān)答案。
使用 LLM 內(nèi)存增強(qiáng)回答的相關(guān)性
Redis 通過(guò)使用合適的數(shù)據(jù)類型來(lái)保存整個(gè)對(duì)話歷史(記憶)。無(wú)論是在 Redis Copilot 中使用簡(jiǎn)單的列表來(lái)保持交互順序,還是將交互記錄為向量嵌入,我們都致力于提高對(duì)話的質(zhì)量和個(gè)性化水平。當(dāng) Redis Copilot 調(diào)用 LLM 時(shí),會(huì)增加對(duì)話中的相關(guān)記憶,從而提供更優(yōu)質(zhì)的回應(yīng),確保對(duì)話過(guò)程自然流暢,減少誤解。
語(yǔ)義緩存降低開(kāi)支并加快響應(yīng)速度
從 LLM 生成響應(yīng)會(huì)帶來(lái)較高的計(jì)算成本。Redis 通過(guò)將輸入提示及其響應(yīng)存儲(chǔ)在緩存中,并通過(guò)向量搜索進(jìn)行檢索,有效降低了機(jī)器學(xué)習(xí)驅(qū)動(dòng)應(yīng)用的整體開(kāi)銷。
以下圖表概括了用戶與 Redis Copilot 互動(dòng)的過(guò)程:
Redis 的更多可能性
盡管 GenAI 模型是激動(dòng)人心的技術(shù)創(chuàng)新,但將 GenAI 應(yīng)用從實(shí)驗(yàn)室推進(jìn)至生產(chǎn)環(huán)境卻需要可靠且快速的數(shù)據(jù)支持。Redis 是一個(gè)經(jīng)過(guò)驗(yàn)證的平臺(tái),為當(dāng)今各種應(yīng)用場(chǎng)景提供了眾多核心功能。
將響應(yīng)存儲(chǔ)在索引中以便快速檢索及進(jìn)一步處理
從請(qǐng)求到最終響應(yīng),LLM 可能需要幾秒鐘才能將結(jié)果逐字發(fā)送給用戶。為了提升響應(yīng)速度并縮短等待時(shí)間,我們選擇將回復(fù)逐步發(fā)送給用戶,而非等到完整回復(fù)生成后一次性返回。此外,我們?cè)趯?duì)話氣泡中嵌入了從 Redis 數(shù)據(jù)庫(kù)中檢索到的附加上下文信息。
我們選用了 OpenAI 的 GPT-4 作為 LLM,因其穩(wěn)定且快速。盡管 OpenAI 提供了優(yōu)秀的 AI 即服務(wù)功能,但我們還是使用本地嵌入模型來(lái)計(jì)算向量嵌入。具體而言,我們使用 HuggingFace 嵌入模型對(duì)語(yǔ)義緩存中的現(xiàn)有答案進(jìn)行檢索。
全文與分面搜索助力精準(zhǔn)定位文檔信息
盡管語(yǔ)義搜索是當(dāng)前的趨勢(shì),傳統(tǒng)的搜索方式也可以通過(guò)新的人工智能/移動(dòng)語(yǔ)言功能得到增強(qiáng),但全文搜索在通過(guò)匹配關(guān)鍵詞或短語(yǔ)來(lái)檢索信息方面依然是不可或缺的工具。Redis Copilot 集成了 Redis 的實(shí)時(shí)全文檢索功能,增強(qiáng)了對(duì)話體驗(yàn)。Redis 的高亮和摘要功能同樣滿足了用戶對(duì)快速、易讀結(jié)果的需求。
此外,聚合功能對(duì)于幫助用戶了解檢索結(jié)果的數(shù)量及特定搜索的流行度至關(guān)重要。
Redis作為微服務(wù)間的消息中間件
通過(guò)將讀取文檔的任務(wù)委托給獨(dú)立的服務(wù),Redis Copilot 可以利用 Redis 與 RAG 獲取上下文信息。
這種微服務(wù)架構(gòu)有效地將大型單體系統(tǒng)的職責(zé)分解為較小的、松散耦合的服務(wù)。Redis 流是一種持久化的按時(shí)間排序的日志數(shù)據(jù)結(jié)構(gòu),支持向消費(fèi)者發(fā)送異步、可訂閱的消息,從而使數(shù)據(jù)庫(kù)與最新信息保持同步。相應(yīng)服務(wù)通過(guò)存儲(chǔ)在流中的消息觸發(fā)操作,而流則充當(dāng)消息代理。
速率限制保障應(yīng)用穩(wěn)定可靠
Redis Copilot 是搜索文檔、知識(shí)庫(kù)及 Redis 門(mén)戶上所有培訓(xùn)資源的主要入口。然而,保護(hù)關(guān)鍵端點(diǎn)免受過(guò)載是所有公共服務(wù)的基本要求,因?yàn)樗?a class="article-link" target="_blank" href="/tag/%E4%BA%92%E8%81%94%E7%BD%91/">互聯(lián)網(wǎng)服務(wù)都可能遭受濫用和攻擊,如 DDoS 攻擊。Redis 一直以來(lái)都是應(yīng)用程序服務(wù)器、API 網(wǎng)關(guān)等的速率限制工具。我們利用 Redis 作為速率限制器,確保 Redis Copilot 的穩(wěn)定性,并在不同會(huì)話和 IP 地址之間均衡使用。當(dāng)使用量超出預(yù)設(shè)閾值時(shí),Redis 會(huì)介入,防止濫用。
了解Redis更多信息,歡迎前往【艾體寶】官方網(wǎng)站:
https://www.itbigtec.com/products-database-redisenterprise
聯(lián)系技術(shù)工程師:TEL:15627590301