|
|
2 روز پیش | |
|---|---|---|
| .gitignore | 3 هفته پیش | |
| API_DOCUMENT.md | 3 هفته پیش | |
| Dockerfile | 2 روز پیش | |
| README.md | 3 هفته پیش | |
| app.py | 2 روز پیش | |
| check_duplicate_trigger.py | 3 هفته پیش | |
| config.py | 3 روز پیش | |
| docker-compose.yml | 2 هفته پیش | |
| duplicate_checker.py | 2 روز پیش | |
| requirements.txt | 2 روز پیش | |
| test_similarity.py | 3 هفته پیش |
本服务基于向量相似度检索(FAISS)和 GPT-4o 深度模型,提供数学题目的查重功能。它能够识别语义相似的题目,并在相似度较低但存在重复风险时,调用大模型进行精准裁定。
text-embedding-3-large 模型将题目向量化,通过 FAISS 进行高性能检索。确保已安装 Python 3.8+,并安装相关依赖:
pip install -r requirements.txt
在首次使用前,需要将数据库中的存量题目同步到本地向量索引文件中:
python3 -c "from duplicate_checker import QuestionDuplicateChecker; checker = QuestionDuplicateChecker(); checker.sync_all_from_db()"
启动 Flask 服务供录题系统调用:
python3 app.py
服务默认运行在 8888 端口。
详细的 API 定义请参考 API_DOCUMENT.md。