基于Embedding模型微调的中文意图识别模型(18种意图)-尧图企业网站定制

轻量级意图识别模型基于BGE-M3 Embedding模型搭建训练数据 SetFit/amazon_massive_scenario_zh-CN核心模型结构import torch from torch import nn from sentence_transformers import SentenceTransformer class EmbeddingBasedIntentModel(torch.nn.Module): def __init__(self, embedding_model, device) - None: super().__init__() self.n_classes 18 self.embedding SentenceTransformer(embedding_model, trust_remote_codeTrue).to(device) self.fc nn.Sequential( nn.Linear(1024, 128), nn.ReLU(), nn.Dropout(0.3), nn.Linear(128, self.n_classes), ).to(device) def forward(self, input_ids, attention_mask): x { input_ids: input_ids, attention_mask: attention_mask } x self.embedding(x)[sentence_embedding] x self.fc(x)调用方式from inference import EmbeddingBasedIntentModelWrapper device cpu embedding_path YOUR_PATH_TO_BGE_EMBEDDING model_checkpoint YOUR_PATH_TO_THE_MODEL model EmbeddingBasedIntentModelWrapper(embedding_path, model_checkpoint, device) while True: input_text input(Enter input: ) result model.classify(input_text) print(result) 以下为输出效果 Enter input: 帮我开个灯 iot Enter input: 青花瓷 play Enter input: 外面冷不冷 weather Enter input: 点个汉堡王 takeaway Enter input: 买张去东京的机票 transport Enter input: 英国伦敦现在几点 datetime Enter input: 给谢老板发个邮件 email Enter input: 提醒我下周六和小王出去玩 calendar Enter input: 定个明天早上9点的闹钟 alarm Enter input: 音量调到最小 audio 训练脚本,模型 checkpoint请见Github训练分数IntentAccuracyNews0.847Email0.963IOT0.968Play0.946General0.608Calendar0.925Weather0.936QA0.878Takeway0.895Lists0.852Transports0.919Social0.877Datetime0.951Music0.840Cooking0.847Alram0.990Recommendation0.830Audio0.935Average0.889

相关新闻

破局与重构：大型企业级数字化业务运营平台的深度解构与演进之路（WORD）

20TB 零误差迁移，存储成本减半：天合富家的 2.6→3.3 进化记

电商AI搜索新纪元：如何借力“阿里悟空”级工具，让客户在AI海洋中精准捕获你？

从原理到像素：我是如何用C++和Qt从头实现一个高精度CIE1931xy色度图渲染器的

基于JSP+Servlet的图书购阅与后台管理实战项目（含MySQL数据支持）

Office弹窗噩梦终结指南：手把手教你用一条命令+密钥，永久清除2019/2016/2013的‘盗版提示’

Pyecharts关系图进阶玩法：手把手教你用‘力引导布局’和‘环形布局’优化复杂数据展示

从手工到自动，不同行业的跨越难点有何异同？2026企业智能化转型全解析

基于无锁环形缓冲区：高并发下 Rust Unsafe 代码的安全边界设计与数据吞吐机制

3分钟掌握VideoDownloadHelper：简单高效的网页视频下载插件终极指南 [特殊字符]

DDrawCompat终极指南：三步拯救Windows老游戏兼容性难题

3步解锁Windows安卓应用新体验：轻量级APK安装器完全指南

毕业论文神器！2026最新AI论文写作软件测评与推荐

基于指数矩的车牌识别解析方案【附代码】

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定