- 業界予測
- 航空専門家の視点
求めれば、必ず与えられる:データと対話し、スマートな知見を得る方法
自然言語処理の力を活用し、ハルシネーションを回避しながら構造化データを簡単かつ効率的に照会して要約する方法を学びましょう。
筆者:Thomas Burke, Director of Software Engineering, UI Platform and Alex Brooker, VP R&D at Cirium
データがしばしば新たな石油と呼ばれる世界では、データへのアクセスやその分析方法が驚異的なスピードで進化しています。この分野で最もエキサイティングな進歩の一つは、間違いなく大規模言語モデル(LLM)が主流になってきたことです。今やあらゆる業界の開発者が、LLMの驚くべき能力を解き放つAPI(アプリケーション・プログラミング・インターフェース)にアクセスできるようになっています。
こうしたテクノロジーに関する数多くの有望な応用例の一つとして、自然言語主導のデータアクセスを現実にする能力が挙げられます。データ実務者は常に、自分たちのデータからより効率的に情報を抽出したいと考えており、LLMはそのための魅力的な新機能を備えています。
LLMがどれほど優れているかということはもちろん、LLMがデータを本質的に理解することはできないにせよ、適切に活用すれば、データの照会や要約に役立つのだということを知っておきましょう。しかし、LLMの活用にはいくつかのガイダンスが必要となります。そのようなガイダンスは、自然言語のプロンプトを正確にデータクエリに変換するのに役立つメタデータの形で提供されます。
一般的な方法の一つに、Text-to-SQLがあります。これは、汎用LLMのパワーを活用しつつ、ユーザーの質問、SQLの挙動の詳細を示す「システム・プロンプト」、そしてデータベース・スキーマに関する詳細なメタデータを提供するものです。つまり、ここから何が生まれるのでしょうか?それは、データベースに対して検証、サニタイズ、実行できるようなSQLクエリです。
「AA100便の現在位置は?」
もう一つの一般的な戦略は、「ファンクション・コーリング」として知られているものです。このテクニックは、言語モデルを使用して、関数を呼び出すために使用できるパラメータを生成するものです。ファンクション・コーリング(Function Calling=関数呼び出し)は例えば、「AA100便の現在位置は?」「自分のフライトが遅れる可能性は?」といった質問に答えるべく、Cirium Sky API(英語)を呼び出すために必要なパラメータを生成し、返されたデータを自然言語として要約するとともに、ユーザーにアウトプットを中継することができます。ハルシネーション(事実に基づかない情報を生成すること)を起こすこともありません。
Text-to-SQLとファンクション・コーリングのどちらを選択するかは、目の前にあるタスクによります。Text-to-SQLの方が表現力豊かで、複雑な洞察的知見を提供できることは間違いないのですが、実装次第では、信頼性とセキュリティ上の理由からファンクション・コーリングの方が望ましいかもしれません。
セマンティック・レイヤー(Semantic Layer)は、柔軟なモデリングと、プログラムでアクセス可能な方法を用いたデータの記述を行う上で役に立ちます。
どのようなテクニックを選ぶにせよ、メタデータへのアクセスを提供することは極めて重要です。これに対する一般的で効果的な解決策は、セマンティック・レイヤーの実装です。セマンティック・レイヤー(Semantic Layer)は、柔軟なモデリングと、プログラムでアクセス可能な方法を用いたデータの記述を行う上で役に立ちます。これは、言語モデルへの適切なメタデータの反映を保証するべく、スケーラブルなソリューションの提供を手助けします。
要約すると、自然言語駆動型データのアクセスと分析の統合は、データ専門家の能力を増強し、複雑なタスクを自動化し、さらに膨大なデータセットを扱う際の効率化を促すのです。LLMはどのような製品であれ、その背後にあるシステムの一部に過ぎず、Text-to-SQL、ファンクション・コーリングともに、今やスタックの一部となっています。
LLMが進化し続ける中、この分野でのより一層の刺激的な発展が期待されています。この分野でのさらなる最新情報に期待しましょう。当社の研究開発チームにぜひお問い合わせください。
最新の生成AIテクノロジーに興味がおありですか?
最新情報をご希望の方は、当社チームまでお問い合わせください CTA。または、当社ラボチームとの協働に関心がおありの方はご登録をお願いします。Cirium Sky API(英語)の詳細については、こちらをご覧ください 。