File tree Expand file tree Collapse file tree 2 files changed +12
-11
lines changed Expand file tree Collapse file tree 2 files changed +12
-11
lines changed Original file line number Diff line number Diff line change 7373
7474本智能助手首批覆盖葡萄城四大核心产品线,具体如下:
7575
76- |  产品                   |  类型           |  核心能力                            |  官网                                                                         | 
77- |  ---------------------- |  -------------- |  ----------------------------------- |  ---------------------------------------------------------------------------- | 
78- |  ** 活字格**  |  低代码开发平台 |  企业级应用快速构建、可视化开发      |  [ 访问] ( https://www.grapecity.com.cn/solutions/huozige )                        | 
79- |  ** Wyn Enterprise**      |  嵌入式商业智能 |  自助式数据分析、多维度报表展示      |  [ 访问] ( https://www.grapecity.com.cn/solutions/wyn )                            | 
80- |  ** SpreadJS**            |  表格控件       |  纯前端表格处理、Excel 兼容性        |  [ 访问] ( https://www.grapecity.com.cn/developer/spreadjs )                       | 
81- |  ** GcExcel**             |  服务端表格组件 |  高性能批量文档生成、云端 Excel 处理 |  [ 访问] ( https://www.grapecity.com.cn/developer/grapecitydocuments/excel-java )  | 
76+ |  产品               |  类型           |  核心能力                            |  官网                                                                         | 
77+ |  ------------------ |  -------------- |  ----------------------------------- |  ---------------------------------------------------------------------------- | 
78+ |  ** 活字格**          |  低代码开发平台 |  企业级应用快速构建、可视化开发      |  [ 访问] ( https://www.grapecity.com.cn/solutions/huozige )                        | 
79+ |  ** Wyn Enterprise**  |  嵌入式商业智能 |  自助式数据分析、多维度报表展示      |  [ 访问] ( https://www.grapecity.com.cn/solutions/wyn )                            | 
80+ |  ** SpreadJS**        |  表格控件       |  纯前端表格处理、Excel 兼容性        |  [ 访问] ( https://www.grapecity.com.cn/developer/spreadjs )                       | 
81+ |  ** GcExcel**         |  服务端表格组件 |  高性能批量文档生成、云端 Excel 处理 |  [ 访问] ( https://www.grapecity.com.cn/developer/grapecitydocuments/excel-java )  | 
82+ 
83+ ## 附录 - 视频公开课  
84+ 
85+ -    本项目同时提供公开课视频:[ 《企业自建知识库:RAG 的从零实践与开源共享》] ( https://learn.grapecity.com.cn/CRS_detail?courseid=community-573 ) 
86+ -    观看方式:微信扫码注册后即可观看直播回放
87+ -    视频时长:1 小时
Original file line number Diff line number Diff line change 22
33本章节介绍 GC-QA-RAG 智能问答系统的文档切片原理,即如何将原始文档的知识点切片后存入向量数据库。
44
5- -    本项目同时提供公开课视频:[ 《企业自建知识库:RAG 的从零实践与开源共享》] ( https://learn.grapecity.com.cn/CRS_detail?courseid=community-573 ) 
6- -    观看方式:微信扫码注册后即可观看直播回放
7- -    视频时长:1 小时
8- 
95## 1. 原始思路  
106
117我们最初的设想非常直接:** 将整个文档作为输入,交由大语言模型自动生成问答对(QA Pairs)** ,以支持后续知识检索和问答系统的构建。
@@ -68,7 +64,6 @@ single_group_template = """
6864考虑到中文技术文档中可能存在代码片段或特殊符号(如“.”出现在变量名中),我们在分句时做了以下处理:
6965
7066-    主要使用“。”、“?”、“!”等作为断句标志;
71- -    对包含特殊字符的语句进行保留不切分处理;
7267-    自动过滤空白句与无效段落。
7368
7469该策略显著提升了短文档的信息抽取完整性与准确性。
    
 
   
 
     
   
   
          
     
  
    
     
 
    
      
     
 
     
    You can’t perform that action at this time.
  
 
    
  
     
    
      
        
     
 
       
      
     
   
 
    
    
  
 
  
 
     
    
0 commit comments