微軟開源下一代RAG技術

檢索增強生成（RAG）是一種根據用戶查詢搜索信息並提供結果作為生成人工智慧答案的參考的技術。
該技術是大多數基於LLM的工具的重要組成部分，並且大多數RAG方法使用載體相似度作為搜索技術。
GraphRAG使用LLM生成的知識圖來極大地提高分析文檔中複雜信息時問答的性能。
這基於最近的研究，該研究指出，在處理私有數據集時，發現的能力會立即增強。
在這裡，私有數據集被定義為LLM尚未訓練並且以前從未見過的數據，
例如企業專有研究、商業文檔或通信。創建基線RAG是為了幫助解決這個問題，但我們觀察到基線RAG的性能非常差。

微軟研究院推出了GraphRAG，這是一種高級方法，旨在提高大型語言模型（LLM）從私有數據集檢索和生成響應的能力。這種創新方法使用LLM生成的知識圖來顯著提高傳統檢索增強生成（RAG）方法的問答性能。

GraphRAG是一種結構化的分層方法，用於實現檢索增強生成（RAG），它使用知識地圖來提高大型語言模型（LLM）的輸出質量。

GraphRAG能夠連接大量信息中的信息，並使用這些連接來回答使用關鍵字和基於載體的搜索機制難以回答的問題。它可以回答跨越多個文檔的問題，以及主題問題，例如「數據集中的主要主題是什麼？」"

通過LLM結合圖機器學習構建知識圖，極大地增強了LLM處理私有數據時的性能，使系統能夠處理全局問題，支持大規模文本庫的全局問題答案，並提供更全面、多樣化的答案。與此同時，GraphRAG能夠在將點連接成線的大型數據集中推理複雜的語義問題。

與主要依賴於載體相似性搜索的傳統基線RAG方法不同，GraphRAG使用知識地圖在處理複雜信息時提供顯著的問答性能改進。

如果您想了解更多信息，可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡，請訂閱並點讚。謝謝

微軟博客：https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/
https://microsoft.github.io/graphrag/

輸油管：