白皮书 — 计算机智能辅助教学系统 (CIATS)

摘要

本白皮书介绍了"计算机智能辅助教学系统"（CIATS）的学术设计与实现方案，目标是构建一个能够自动生成结构化、符合教学原则的网页化教学材料的 AI 平台。文中讨论了理论基础、模型选择、提示词工程、系统架构、数据模式、评估方法、安全性、法律合规和研究路线图。

CIATS 位于教育技术、自然语言处理与人机交互的交叉点。我们的贡献包括：（1）一种将教学目标形式化为模块化网页组件的流水线方法，（2）用于可读性、教学一致性与学生学习效果的经验评估协议，以及（3）确保隐私与知识产权合规的安全运营规范。

1. 引言

近年来大型预训练语言模型（PLMs）的发展为自动内容生成提供了新的可能性。在教育领域，批量生成高质量的教案、讲解、示例与形成性测评具有变革性潜力。然而，简单地调用 PLM 并不能满足需求：必须解决教学有效性、一致性、适应性与伦理问题，才能生成适用于课堂的材料。

本白皮书采取学术视角：我们定义可量化的评估指标，提出算法流水线，并将系统建立在学习科学原则之上（例如间隔重复、认知负荷理论），同时制定可复现的实验方案。我们的目标是为构建稳健的 AI 辅助教学系统提供研究蓝图与工程指导。

我们的贡献包括：将学习目标映射为多格式网页产物的模块化流水线；结合检索与生成的混合策略以确保事实性和适应性；支持教师参与验证的实验协议；以及面向第三方与复现研究的开放 API。

2. 相关工作

在 NLP 与教育的交叉研究中，已有工作探讨自动题目生成、智能辅导系统（ITS）和自适应学习平台。先前的 ITS（例如 Cognitive Tutors 与 AutoTutor）强调学生模型与脚手架策略。近来基于 transformer 的模型帮助实现自然语言讲解与内容合成，但文献同时指出事实性、与课程标准的对齐以及可测量学习收益方面仍存在挑战。

我们基于两条主线：一是检索增强生成（RAG）以保证事实性；二是将教学内容表示为可组合的模块（目标、讲解、示例、练习）。CIATS 的不同之处在于将严格的教学约束与可复现的实验流水线结合，以衡量学习效果。

3. 问题陈述

我们将任务形式化：给定输入 prompt P（包括学习目标、年级、期望长度、教学约束），生成一个网页化教学单元 U，由有序模块 M = {m1, m2, ...} 构成。每个模块类型（简介、教学目标、讲解、示例、练习、评估、总结）和元数据（难度、预计时间、先修知识）需被明确标注。输出需满足：课程对齐、事实正确、面向目标年龄的可读性，并且能够带来可测量的学习收益。

关键挑战包括：（a）将高层目标映射为分层脚手架式教学；（b）确保生成示例的正确性与教学适配性；（c）以经济且可复现的方式评估学习效果；（d）当模型与内容库交互时，保护用户隐私和知识产权合规性。

4. 系统架构

CIATS 采用模块化架构：前端 UI（Tailwind CSS + JavaScript）、后端 API（PHP 微服务）、数据库（MySQL）、检索层（文档库）与模型层（通过安全 API 调用 LLM）。概念流程如下：

User prompt → Intent/Metadata parsing → Curriculum planner → Retrieval module (knowledge & assets)
    → Generation module (LLM & post-processing) → Renderer (HTML / interactive components) → Storage & Analytics

设计原则包括关注点分离、可复现性、可观测性与教师参与机制。每个生成产物都带有版本控制；教师可以接受/修改/拒绝生成内容，且在允许情况下，人工编辑可回馈至模型微调数据集。

智能试卷生成

一键生成各科目、各难度等级的试卷，支持自定义题型和数量，自动导出 PDF 格式

教学页面生成

AI 智能生成个性化教学资源和教案，包含互动元素、示例代码和练习题

课程资源库

浏览已生成的高质量教学资源和教案，灵活组织教学内容，支持搜索和筛选

用户使用管理

完整的使用配额系统，支持次数充值、使用记录查询和订单管理

检索模块包含两部分：（1）经过策划的资源库（图片、视频、测评题目）；（2）支持语义检索的向量化知识库。检索结果作为生成模块的背景知识，以降低模型幻觉。

5. 数据库设计

关系型模式保存用户、使用配额、生成页面、页面区块、系统设置与日志。建议采用范式化表结构并使用外键与时间戳以便审计。模块元数据包括：模块类型、难度等级、预计时间、先修概念、关键词与学习成果。

users(id, username, email, password_hash, role, created_at, last_login)
user_usage(user_id, remaining_uses, total_used, last_reset)
generated_pages(id, user_id, prompt, title, page_url, status, created_at)
page_sections(id, page_id, section_type, section_html, order_index, metadata_json)
system_settings(key, value, category)
logs(id, user_id, action, details, created_at)

为实现可复现研究，每个生成产物需记录：模型版本、prompt 文本、检索上下文 ID、确定性随机种子与评估注释（教师反馈、测试结果）。这有助于后续分析与模型改进。

6. AI生成方法

CIATS 采用混合检索增强生成（RAG）策略。系统在接收 prompt 后由规划器生成模块级子提示。对每个模块，从向量库中检索相关段落或素材（top-k），并将 prompt 与检索上下文一并送入生成器。后处理阶段应用规则验证（例如数值检查、编程示例的代码执行、与课程标准的对齐检测）。

提示词工程：提示词采用模板化并根据教学因素（年龄、认知负荷、脚手架级别）参数化。我们维护提示词注册表，并使用元提示词要求模型输出结构化 JSON，便于解析与渲染。

模型：我们评估多种模型族——指令微调的 transformer（GPT 类）、开源 LLM（LLaMA 衍生）以及专门的教育模型（若可用）。模型选择需要在生成质量、延迟、成本与可控性之间权衡。

验证层包括：（1）句法与语义验证；（2）基于检索与交叉比对的知识验证；（3）教师参与的审核界面。低置信或不合格模块会被标记并要求审核后方可发布。

7. 实现细节

后端：采用微服务架构，分离 API 网关、提示服务、检索服务、生成服务与分析服务。生成服务通过安全 API 调用 LLM，密钥定期轮换并记录使用情况。前端：单页应用，模块化渲染器支持可编辑区块与实时预览。

存储：主关系型数据库保存用户与页面元数据；文档存储或对象存储保存媒体资源；向量数据库保存嵌入向量。监控包括请求追踪、延迟指标与错误日志。通过功能开关与分层随机抽样支持 A/B 实验。

教师界面：支持预览、内联编辑、接受/拒绝与注释。所有修改以变更记录保留，支持回滚并为监督式微调创建数据集。

8. 评估方案

我们提出多层次评估方法：（A）语言质量的内在评估（困惑度、连贯性），（B）教学对齐性（专家基于评分量表的评估），（C）学生效果实验（随机对照试验测量前后分数提升），以及（D）人因评估（可用性、教师工作量）。

实验设计：在学校/年级上进行分层随机试验；结果度量包括标准化测试成绩、知识保持（延迟后测）与迁移任务。统计分析采用混合效应模型以考虑嵌套数据（学生嵌入班级）。

9. 安全与隐私

隐私原则：最小特权、数据最小化、研究数据匿名化、静态与传输加密。教师与学生数据隔离；只有在必要并经同意时才存储个人身份信息。汇总分析采用去标识化以防反匿名化。

安全措施：基于角色的访问控制、日志与审计轨迹、安全密钥管理与定期安全评审。模型 API 调用避免传输原始个人身份信息；如需传输则先进行标记化或假名化处理。

10. 法律与知识产权

知识产权：在使用第三方内容进行知识支撑时须遵守许可协议。生成内容的所有权需在服务条款中明示；教师编辑可能构成衍生作品，应有明确政策。需遵守各司法辖区的教育与数据合规（例如数据驻留、内容审查）。

伦理使用：开展公平性审计、训练数据偏见检测、对 AI 生成内容添加明确免责声明，并保持教师的监督机制。

11. 路线图

短期（0-6 个月）：构建 MVP，集成 LLM 提供方，开发教师审查界面并开展试点研究。中期（6-18 个月）：支持多语言内容，部署向量数据库，开展分层实验。长期（18+ 个月）：微调领域模型，使内容与课程标准认证对齐，并探索隐私敏感场景下的离线/端侧生成。

12. 结论

CIATS 提供了一个以研究为导向的教学内容自动化路径。通过将学习科学原则、检索-生成混合技术与教师参与的验证相结合，系统旨在增强教师能力而非替代。严格评估与负责任部署是我们的核心路线。

参考文献

[1] VanLehn, K. (2006). 辅导系统的行为。《人工智能与教育国际期刊》。

[2] Lewis, M. 等人 (2020). 用于知识密集型 NLP 任务的检索增强生成。

[3] Brown, T. 等人 (2020). 语言模型是少样本学习者。NeurIPS。

（最终版本将补充更多参考文献。）

智能试卷生成

教学页面生成

课程资源库

用户使用管理

目录