基于您提供的Navic.txt文件这是一个 PostgreSQL 数据库的导出脚本属于SQLBot / DataEase系统库 sqlbot我为您整理了一份详细的数据库表结构文档。这份文档将表按功能模块进行了分类并详细列出了关键字段及其含义。⚠️ 重要提示该数据库类型为PostgreSQL(版本 14)并非 MySQL。虽然语法相似但部分数据类型如int8,text,jsonb,vector是 PG 特有的。系统中使用了vector类型和相关的向量距离函数说明该系统深度集成了RAG (检索增强生成)能力用于语义搜索。 SQLBot 系统数据库字典 (v1.0)1. 核心元数据模块 (Core Metadata)用于管理连接的数据源、同步的表结构及字段信息是 Text-to-SQL 的基础。1.1 数据源配置 (core_datasource)存储用户连接的各类数据库连接信息。字段名类型含义/备注idint8主键namevarchar数据源名称typevarchar数据库类型 (MySQL, PG, Oracle等)configurationtext加密后的连接配置信息 (JSON格式)statusvarchar连接状态table_relationjsonb表之间的关联关系定义embeddingtext数据源级别的向量化描述 (用于语义检索)recommended_configint8推荐问题配置ID1.2 表元数据 (core_table)存储从数据源同步过来的物理表信息。字段名类型含义/备注idint8主键ds_idint8关联数据源ID (core_datasource.id)checkedbool是否被选中纳入知识库table_nametext物理表名table_commenttext原始表注释custom_commenttext人工修正/补充的业务注释 (关键提升SQL生成准确率)embeddingtext表描述的向量值countint8表行数统计1.3 字段元数据 (core_field)存储表中的具体字段信息。字段名类型含义/备注idint8主键ds_idint8关联数据源IDtable_idint8关联表ID (core_table.id)checkedbool是否启用该字段field_nametext物理字段名field_typevarchar字段类型 (varchar, int, date等)field_commenttext原始字段注释custom_commenttext人工修正/补充的业务含义 (关键)field_indexint8字段顺序1.4 表行统计 (table_row_stat)记录表的行数和数据大小统计历史。字段名类型含义/备注datasource_idint8数据源IDtable_namevarchar表名row_countint8行数table_size_kbint8表大小 (KB)stat_timetimestamp统计时间2. 会话与问答历史模块 (Chat History)记录用户与机器人的交互过程、生成的 SQL 及执行结果。2.1 会话主表 (chat)代表一次完整的对话会话Session。字段名类型含义/备注idint8主键briefvarchar会话标题/摘要chat_typevarchar会话类型datasourceint8关联数据源IDengine_typevarchar使用的引擎类型recommended_questiontext推荐的后续问题列表create_byint8创建人ID2.2 问答记录明细 (chat_record)会话中的每一轮具体问答记录。字段名类型含义/备注idint8主键chat_idint8关联会话IDquestiontext用户提问的自然语言sqltext模型生成的 SQL 语句sql_answertextSQL 执行后的文本结论datatextSQL 执行后的原始数据 (JSON)charttext生成的图表配置errortext执行报错信息 (如有)analysistext模型生成的分析解读finishbool是否执行完成create_timetimestamp创建时间2.3 模型调用日志 (chat_log)记录底层大模型调用的详细开销和过程。字段名类型含义/备注idint8主键pidint8关联的记录IDai_modal_idint8使用的模型IDmessagesjsonb发送给模型的完整 Prompt 消息链reasoning_contenttext模型的推理过程内容 (Thinking process)token_usagejsonbToken 消耗详情(input/output)start_timetimestamp开始时间finish_timetimestamp结束时间errorbool是否出错3. AI 模型与提示词模块 (AI Prompts)管理接入的大模型配置及自定义提示词。3.1 AI 模型配置 (ai_model)字段名类型含义/备注idint8主键namevarchar模型展示名称supplierint4供应商类型 (阿里/百度/开源等)api_keytext加密的API Keyapi_domaintextAPI 请求域名base_modelvarchar基础模型标识 (如 qwen-max)configtext额外配置参数 (JSON)default_modelbool是否为默认模型3.2 自定义提示词 (custom_prompt)用户自定义的系统提示词模板。字段名类型含义/备注idint8主键namevarchar提示词名称prompttext提示词具体内容typevarchar适用场景类型specific_dsbool是否限定特定数据源datasource_idsjsonb限定的数据源ID列表3.3 术语库 (terminologyterms)用于增强模型对业务专有名词的理解。terminology: 高级术语表支持向量检索 (embedding字段)可绑定特定数据源。word: 术语名称description: 术语解释enabled: 是否启用terms: 基础术语表。term: 术语definition: 定义domain: 所属领域3.4 训练数据/示例库 (data_training)存储 Few-Shot (少样本学习) 的问答对用于微调或上下文增强。字段名类型含义/备注questionvarchar示例问题descriptiontext示例描述/答案逻辑embeddingvector问题的向量表示(用于语义相似度匹配)datasourceint8关联数据源enabledbool是否启用4. 权限与安全模块 (Security Permission)细粒度的数据权限控制和系统安全配置。4.1 数据源权限 (ds_permission)定义谁可以访问哪些表或行。字段名类型含义/备注auth_target_typevarchar授权对象类型 (用户/角色)auth_target_idint8授权对象IDds_id/table_idint8限制的数据源或表expression_treetext行级权限过滤表达式(如dept_id 101)white_list_usertext白名单用户4.2 规则管理 (ds_rules)更宏观的访问控制规则。字段名类型含义/备注namevarchar规则名称permission_listtext权限列表user_listtext适用用户列表4.3 系统与用户 (sys_*系列表)sys_user: 系统用户 (账号, 密码, 邮箱, 状态)。sys_workspace: 工作空间 (多租户隔离)。sys_user_ws: 用户与工作空间的关联关系。sys_authentication: 第三方认证配置 (LDAP, OIDC等)。sys_apikey: API 访问密钥管理。rsa: 存储 RSA 公私钥用于加密敏感配置如数据库密码。license: 软件许可证信息。5. 系统运维与日志 (System Logs)5.1 操作日志 (sys_logs)记录所有用户的关键操作行为。字段名类型含义/备注operation_typevarchar操作类型user_namevarchar操作人ip_addressvarchar来源IPexecution_timeint8耗时 (ms)error_messagetext错误信息request_pathvarchar请求接口路径5.2 仪表盘 (core_dashboard)存储可视化的报表和大屏配置信息。canvas_style_data: 画布样式component_data: 组件数据配置canvas_view_info: 视图信息 关键设计特点总结向量数据库集成定义了vector类型。在data_training,terminology,core_table,core_datasource中都有embedding字段。用途实现 RAG 架构。当用户提问时系统先将问题向量化然后在这些表中检索最相关的表结构、术语或历史问答对拼接到 Prompt 中发给大模型从而大幅提高 SQL 生成的准确率。双注释机制在core_table和core_field中同时存在xxx_comment(原始数据库注释) 和custom_comment(人工自定义注释)。用途允许业务人员修正数据库中原有的晦涩注释让大模型更容易理解业务含义例如将col_01标记为用户手机号。行级权限控制ds_permission表中的expression_tree字段。用途在生成 SQL 时系统会自动将该表达式拼接到WHERE条件中确保不同用户只能查到自己有权限的数据行。完整的审计链路从chat(会话) -chat_record(问答明细) -chat_log(模型调用细节/Token消耗)。用途不仅可以追溯用户问了什么还能分析是哪个模型、消耗了多少 Token、推理过程是什么便于成本核算和效果优化。
SQLBot 系统数据库字段
基于您提供的Navic.txt文件这是一个 PostgreSQL 数据库的导出脚本属于SQLBot / DataEase系统库 sqlbot我为您整理了一份详细的数据库表结构文档。这份文档将表按功能模块进行了分类并详细列出了关键字段及其含义。⚠️ 重要提示该数据库类型为PostgreSQL(版本 14)并非 MySQL。虽然语法相似但部分数据类型如int8,text,jsonb,vector是 PG 特有的。系统中使用了vector类型和相关的向量距离函数说明该系统深度集成了RAG (检索增强生成)能力用于语义搜索。 SQLBot 系统数据库字典 (v1.0)1. 核心元数据模块 (Core Metadata)用于管理连接的数据源、同步的表结构及字段信息是 Text-to-SQL 的基础。1.1 数据源配置 (core_datasource)存储用户连接的各类数据库连接信息。字段名类型含义/备注idint8主键namevarchar数据源名称typevarchar数据库类型 (MySQL, PG, Oracle等)configurationtext加密后的连接配置信息 (JSON格式)statusvarchar连接状态table_relationjsonb表之间的关联关系定义embeddingtext数据源级别的向量化描述 (用于语义检索)recommended_configint8推荐问题配置ID1.2 表元数据 (core_table)存储从数据源同步过来的物理表信息。字段名类型含义/备注idint8主键ds_idint8关联数据源ID (core_datasource.id)checkedbool是否被选中纳入知识库table_nametext物理表名table_commenttext原始表注释custom_commenttext人工修正/补充的业务注释 (关键提升SQL生成准确率)embeddingtext表描述的向量值countint8表行数统计1.3 字段元数据 (core_field)存储表中的具体字段信息。字段名类型含义/备注idint8主键ds_idint8关联数据源IDtable_idint8关联表ID (core_table.id)checkedbool是否启用该字段field_nametext物理字段名field_typevarchar字段类型 (varchar, int, date等)field_commenttext原始字段注释custom_commenttext人工修正/补充的业务含义 (关键)field_indexint8字段顺序1.4 表行统计 (table_row_stat)记录表的行数和数据大小统计历史。字段名类型含义/备注datasource_idint8数据源IDtable_namevarchar表名row_countint8行数table_size_kbint8表大小 (KB)stat_timetimestamp统计时间2. 会话与问答历史模块 (Chat History)记录用户与机器人的交互过程、生成的 SQL 及执行结果。2.1 会话主表 (chat)代表一次完整的对话会话Session。字段名类型含义/备注idint8主键briefvarchar会话标题/摘要chat_typevarchar会话类型datasourceint8关联数据源IDengine_typevarchar使用的引擎类型recommended_questiontext推荐的后续问题列表create_byint8创建人ID2.2 问答记录明细 (chat_record)会话中的每一轮具体问答记录。字段名类型含义/备注idint8主键chat_idint8关联会话IDquestiontext用户提问的自然语言sqltext模型生成的 SQL 语句sql_answertextSQL 执行后的文本结论datatextSQL 执行后的原始数据 (JSON)charttext生成的图表配置errortext执行报错信息 (如有)analysistext模型生成的分析解读finishbool是否执行完成create_timetimestamp创建时间2.3 模型调用日志 (chat_log)记录底层大模型调用的详细开销和过程。字段名类型含义/备注idint8主键pidint8关联的记录IDai_modal_idint8使用的模型IDmessagesjsonb发送给模型的完整 Prompt 消息链reasoning_contenttext模型的推理过程内容 (Thinking process)token_usagejsonbToken 消耗详情(input/output)start_timetimestamp开始时间finish_timetimestamp结束时间errorbool是否出错3. AI 模型与提示词模块 (AI Prompts)管理接入的大模型配置及自定义提示词。3.1 AI 模型配置 (ai_model)字段名类型含义/备注idint8主键namevarchar模型展示名称supplierint4供应商类型 (阿里/百度/开源等)api_keytext加密的API Keyapi_domaintextAPI 请求域名base_modelvarchar基础模型标识 (如 qwen-max)configtext额外配置参数 (JSON)default_modelbool是否为默认模型3.2 自定义提示词 (custom_prompt)用户自定义的系统提示词模板。字段名类型含义/备注idint8主键namevarchar提示词名称prompttext提示词具体内容typevarchar适用场景类型specific_dsbool是否限定特定数据源datasource_idsjsonb限定的数据源ID列表3.3 术语库 (terminologyterms)用于增强模型对业务专有名词的理解。terminology: 高级术语表支持向量检索 (embedding字段)可绑定特定数据源。word: 术语名称description: 术语解释enabled: 是否启用terms: 基础术语表。term: 术语definition: 定义domain: 所属领域3.4 训练数据/示例库 (data_training)存储 Few-Shot (少样本学习) 的问答对用于微调或上下文增强。字段名类型含义/备注questionvarchar示例问题descriptiontext示例描述/答案逻辑embeddingvector问题的向量表示(用于语义相似度匹配)datasourceint8关联数据源enabledbool是否启用4. 权限与安全模块 (Security Permission)细粒度的数据权限控制和系统安全配置。4.1 数据源权限 (ds_permission)定义谁可以访问哪些表或行。字段名类型含义/备注auth_target_typevarchar授权对象类型 (用户/角色)auth_target_idint8授权对象IDds_id/table_idint8限制的数据源或表expression_treetext行级权限过滤表达式(如dept_id 101)white_list_usertext白名单用户4.2 规则管理 (ds_rules)更宏观的访问控制规则。字段名类型含义/备注namevarchar规则名称permission_listtext权限列表user_listtext适用用户列表4.3 系统与用户 (sys_*系列表)sys_user: 系统用户 (账号, 密码, 邮箱, 状态)。sys_workspace: 工作空间 (多租户隔离)。sys_user_ws: 用户与工作空间的关联关系。sys_authentication: 第三方认证配置 (LDAP, OIDC等)。sys_apikey: API 访问密钥管理。rsa: 存储 RSA 公私钥用于加密敏感配置如数据库密码。license: 软件许可证信息。5. 系统运维与日志 (System Logs)5.1 操作日志 (sys_logs)记录所有用户的关键操作行为。字段名类型含义/备注operation_typevarchar操作类型user_namevarchar操作人ip_addressvarchar来源IPexecution_timeint8耗时 (ms)error_messagetext错误信息request_pathvarchar请求接口路径5.2 仪表盘 (core_dashboard)存储可视化的报表和大屏配置信息。canvas_style_data: 画布样式component_data: 组件数据配置canvas_view_info: 视图信息 关键设计特点总结向量数据库集成定义了vector类型。在data_training,terminology,core_table,core_datasource中都有embedding字段。用途实现 RAG 架构。当用户提问时系统先将问题向量化然后在这些表中检索最相关的表结构、术语或历史问答对拼接到 Prompt 中发给大模型从而大幅提高 SQL 生成的准确率。双注释机制在core_table和core_field中同时存在xxx_comment(原始数据库注释) 和custom_comment(人工自定义注释)。用途允许业务人员修正数据库中原有的晦涩注释让大模型更容易理解业务含义例如将col_01标记为用户手机号。行级权限控制ds_permission表中的expression_tree字段。用途在生成 SQL 时系统会自动将该表达式拼接到WHERE条件中确保不同用户只能查到自己有权限的数据行。完整的审计链路从chat(会话) -chat_record(问答明细) -chat_log(模型调用细节/Token消耗)。用途不仅可以追溯用户问了什么还能分析是哪个模型、消耗了多少 Token、推理过程是什么便于成本核算和效果优化。