Robust_Prover
Robust_Prover
├── README.md
├── .git/
├── .gitattributes
├── .gitignore
└── Paper/
Proposal: Robust Mathematical Problem Solver
- 关于robustness:以往研究显示在提示词中加入无关信息(比如猫猫)会让模型的推理能力大幅下降(Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models),同时需要防范提示词注入等,增加模型的抗干扰能力
- 关于数学:数学能力是衡量模型推理能力等重要指标,有专门的程序语言(如lean等)检查逻辑是否正确
- 关于agent:现在数据集趋于完善,但模型处理不恰当输入和自我纠错的能力并不强,利用agent调用多种工具或许可以解决这个问题
MCP协议安全性: https://mp.weixin.qq.com/s/IH5esRD9mzwbq5TCYF9eHg
Concept Explanations
- AI agent - 自主感知、决策与行动的人工智能系统
- 自然语言推理 - 用人类语言表达的逻辑推理过程
- 形式化证明 - 符合严格逻辑规则的计算机验证证明
- 形式化语言(如lean) - 为逻辑证明设计的严密表达方式
- 模型微调(fine-tune) - 针对特定任务的进一步训练
Info
Programme Cohort: Large Language Models & Generative AI
Course Group: GEA-Group 2
Group Name: Robust Mathematical Problem Solver
Group Members: Liu Peixuan, Long Haobo, Cao Shuhan, Wu Jiayu, Wu Xuanyu, Wei Yanran, Jin Huiyan
slogan: Logic. Rigor. Automation.
Proposed Workflow
- 预处理去干扰
- 生成自然语言推理
- 转写成形式化语言(如lean)进行自动检验
- 根据反馈调整
扩展方向:
- 对模型进行微调(fine-tune)以使其更适合这个任务
- 设计更适合根据已有论文形式化的工作流
Development Team:
- Anti-interference implementation (Python) - Long Haobo
- Natural language reasoning generation and transformation (LLM calling & Agent) - Cao Shuhan
- Auto-correction implementation (Agent) - Wu Jiayu
Data Team: - Math problem dataset collection and organization - Wu Xuanyu
Evaluation Team: - Test framework setup/metric calculation - Wei Yanran
- Evaluation results analysis - Jin Huiyan
Coordination Team: - Progress tracking/documentation - Liu Peixuan
没有必要死板, 可以互相学习帮助
我现在在改project proposal, 因为overleaf的限制只能一个人编辑, 其他人只能看, 大家看了有需要改的地方可以联系我
关于最终的目标, 其实只需要最终能提高准确率就可以了,方法没有必要死板, 可以互相学习帮助,现在提出的几种方法或者还找的其他方法有成功的就行了, 同时需要构建整体的框架,主要是题库和评估方法
大家可以再找一些自己任务对应的文献和资料, 现在用于project proposal的文献已经够了, 主要是用于后面完成项目, 可以分享到群里
Key References
- DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition
- Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models
- A Language-Agent Approach to Formal Theorem-Proving
- An In-Context Learning Agent for Formal Theorem-Proving
- Prover Agent: An Agent-based Framework for Formal Mathematical Proofs
Robust_Prover
http://kaelvio.com/Robust_Prover/