PydanticToolsParser 工具(tool call)把 LLM 生成的文本转成结构化的数据(Pydantic 模型)过程中遇到的坑

news/2025/2/27 6:16:37

PydanticToolsParser 的作用
PydanticToolsParser 是一个工具,主要作用是 把 LLM 生成的文本转成结构化的数据(Pydantic 模型),让代码更容易使用这些数据进行自动化处理。

换句话说,AI 生成的文本通常是自然语言,代码不好直接解析,比如 “请帮我订明天上午 10 点到上海的机票”。
如果用 PydanticToolsParser,就可以把这句话解析成一个 Python 对象,比如:

FlightBookingRequest(
    destination="上海",
    time="2025-02-27 10:00:00"
)

这样,代码就可以直接使用这个对象去调用订票 API,自动执行任务。

但是我们在调用工具的过程中会遇到类似以下问题:
在这里插入图片描述

可以从以下几个方面去思考排查

  1. 模型不支持或工具调用能力有限

    • 有用户建议更换模型,例如使用“llama-3.3-70b-versatile”或者“llama-3.1-8b-instant”(参见citeturn0search0中的讨论),这些模型在工具调用的兼容性和稳定性上表现更佳。
  2. 提示(prompt)设计问题

    • 如果提示不够明确,模型可能会生成不完整或格式错误的工具调用请求。例如,提示中没有充分说明需要返回完整的 JSON 格式,导致生成的参数中缺失了某些字段。

如何调试与解决

方案一:调整提示格式
确保在提示中明确说明所需的 JSON 格式。例如,在提示中增加类似下面的说明:

python">query = """
请使用 MathCalculationRequest 工具计算 34 * 5,并按照如下 JSON 格式返回:
{
  "expression": "34 * 5",
  "result": 170.0
}
"""

这样模型能获得更多上下文,从而更准确地生成符合要求的输出。

方案二:更换模型
如前面搜索讨论中建议,尝试使用其他推荐的模型,例如“llama-3.3-70b-versatile”。更换模型的方法如下:

python">llm = init_chat_model("llama-3.3-70b-versatile", model_provider="groq")

这有助于绕过当前模型在工具调用方面存在的问题。

我遇到的问题主要出在 LLM模型不够强,更换参数更大的模型。


原始有问题的代码如下:

python">import getpass
import os
from datetime import datetime, timedelta
from typing import Union
from pydantic import BaseModel
from langchain.chat_models import init_chat_model
from langchain_core.output_parsers.openai_tools import PydanticToolsParser


# 1. 获取 API Key
if not os.environ.get("GROQ_API_KEY"):
    os.environ["GROQ_API_KEY"] = getpass.getpass("Enter API key for Groq: ")

# 2. 初始化 LLM
llm = init_chat_model("llama3-8b-8192", model_provider="groq")

# 3. 定义结构化数据模型
class FlightBookingRequest(BaseModel):
    destination: str
    time: str

class ReminderRequest(BaseModel):
    event: str
    time: str

class MathCalculationRequest(BaseModel):
    expression: str
    result: float

# 4. 绑定工具
tools = [FlightBookingRequest, ReminderRequest, MathCalculationRequest]
llm_with_tools = llm.bind_tools(tools)

# 5. 解析 LLM 输出
parser = PydanticToolsParser(tools=tools)
chain = llm_with_tools | parser

def handle_request(request: Union[FlightBookingRequest, ReminderRequest, MathCalculationRequest]):
    print(request)
    if isinstance(request, FlightBookingRequest):
        print(f"正在预订 {request.time} 飞往 {request.destination} 的机票...")
    elif isinstance(request, ReminderRequest):
        print(f"已设置提醒:{request.time} - {request.event}")
    elif isinstance(request, MathCalculationRequest):
        print(f"计算结果:{request.expression} = {request.result}")

    
query =  "用MathCalculationRequest工具解析这个表达式: 34 * 5 "

structured_data = chain.invoke(query)  # AI 解析文本
print(structured_data)
handle_request(structured_data)  # 执行相应任务

修改后的代码请点击查看教程

总结

  • 错误信息表明:模型生成的工具调用请求格式不正确,无法成功解析为 Pydantic 对象。
  • 最有可能的原因是当前使用的 Groq 模型(“llama3-8b-8192”)在工具调用功能上存在局限性或提示设计不足。
  • 推荐尝试调整提示(prompt)、更新依赖库或更换为其他推荐的模型以解决问题。

http://www.niftyadmin.cn/n/5869623.html

相关文章

SAP Webide系列(7)- 优化FreeStyle新建项目预设模板

目录 一、背景 二、优化目标 三、定位调整点 四、调整步骤 五、效果展示 六、附言 一、背景 在每次通过Webide进行FreeStyle方式自开发SAP UI5应用的时候,新建项目,得到的模板文件都是只有很少的内容(没有路由配置、没有设置默认全屏等…

27.[前端开发-JavaScript基础]Day04-函数基本使用-递归-变量作用域-函数式编程

一、JavaScript函数 1 认识JavaScript函数 程序中的foo、bar、baz 认识函数 函数使用的步骤 2 函数的声明和调用 声明和调用函数 函数的参数 有参数的函数练习 函数的返回值 函数的练习 arguments参数(JS高级再学习) 3 函数的递归调用 函数中…

本地大模型编程实战(24)用智能体(Agent)实现智能纠错的SQL数据库问答系统(3)

本文将实现这样一个 智能体(Agent) : 可以使用自然语言对 SQLite 数据库进行查询。即:用户用自然语言提出问题,智能体也用自然语言根据数据库的查询结果回答问题。增加一个自动对查询中的专有名词进行纠错的工具,这将明显提升查询…

CAS (Compare and swap “比较和交换“) [ Java EE 初阶 ]

目录 什么是 CAS CAS 是怎么实现的 CAS 有哪些应用 1. 实现原子类 2. 实现自旋锁 3. CAS 的 ABA 问题 什么是 CAS // 能够比较和交换某个寄存器中的值和内存中的值, 看是否相等, 如果相等, 则把另一个寄存器中的值和内存中的值进行交换 // CAS伪代码 boolean CAS(addres…

微信小程序数据缓存与本地存储:优化用户体验

在前几篇文章中,我们学习了微信小程序的基础知识、数据绑定、事件处理、页面导航与路由、网络请求与API调用以及组件封装与复用。这些知识帮助我们构建了具备基本功能的小程序。然而,在实际开发中,如何高效地管理数据、提升用户体验是一个重要课题。本文将深入探讨微信小程序…

大白话css第一章基础入门

大白话css第一章基础入门 了解CSS基本概念 CSS是干啥的:就好比你装修房子,HTML呢是把房子的框架、房间布局都搭好了,像客厅、卧室、厨房都有了,但是房子里面空空的,啥都没装饰。这时候CSS就上场啦,它就是…

【Win10】Anaconda + Pycharm 环境搭建教程

一、 Anaconda 安装包下载 1. Anaconda官方 https://www.anaconda.com/ 下载较慢, 页面直观 2. 清华镜像站 https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ 二、 Pycharm 安装包下载 https://www.jetbrains.com/pycharm/ 进入官网后,点击此处的Do…

Pytorch实现之脑电波图像生成

简介 简介:采用双GAN模型架构来生成脑电波与目标图像。 论文题目:Image Generation from Brainwaves using Dual Generative Adversarial Training(使用双生成对抗训练的脑电波图像生成) 会议:IEEE Global Conference on Consumer Electronics (GCCE) 摘要:表示通过无…