2026-05-18

_ [雑談]

ふとLLMは理解できるだろうかと思い、在庫は所有者と置き場所の対で表すことができるという話をし、それを踏まえてちょっとした応用例を説明し、次にさらなる応用の場合にどうなると思うかを聞くちょっとしたクイズみたいなものを出した。

これは所有権と場所、そして実際のビジネスの理解があれば分かるたいしたことはない話だと僕は思っている。

そのクイズの結果として、Gemini3は高速モードで普通に正解を出せた、ChatGPTは無料版で不正解、Gemma4とQwen3.6もQ8_K_XLを使って性能を最大限出してもらったつもりだが不正解、でもGemma4はめちゃくちゃ惜しかった、なんというか正解にも言及できているのに答案には不正解を書いちゃっていた、なので不正解。

ということで、非常に残念ながらまだ Local LLM では正解を出せない、クラウド版のAIとの明確な差を確認した。

これくらいは普通に正解してもらえないと困る、Gemini3はそれができるという結果だった。


«前の日記(2026-05-17) 最新