1 сар өмнө · 165b8cc296
--- a/gpt/chatgpt.py
+++ b/gpt/chatgpt.py
@@ -5,6 +5,7 @@ if __name__ == '__main__':
 
															 import requests
														
 
															 import random
														
 
															+import json
														
 
															 import time
														
 
															 from tools.loglog import logger,simple_logger
														
 
															 from tools.new_mysql import MySQLUploader
														
@@ -104,20 +105,19 @@ def get_article_gpt_pydantic(question,real_ip="localhost",demo_name="无",model=
 
															         try:
														
 
															             response = requests.post(f'http://170.106.108.95/get_article', json=d2)
														
 
															-            r_json = response.json()
														
 
															-           
														
 
															-            gpt_content = str(r_json)
														
 
															+            r_str = response.json() 
														
 
															-            simple_logger.info(f"问题日志：\n{question}\n回答日志：\n{gpt_content}")
														
 
															+            simple_logger.info(f"问题日志：\n{question}\n回答日志：\n{r_str}")
														
 
															             if not check_fucn:
														
 
															-                return r_json
														
 
															+                return r_str
														
 
															-            check_result = check_fucn(str(gpt_content))
														
 
															+            check_result = check_fucn(r_str)
														
 
															+
														
 
															             if check_result: 
														
 
															-                return r_json
														
 
															+                return r_str
														
 
															             else:
														
 
															                 raise Exception(f"第{num_count + 1}次共3次，GPT的校验没有通过，校验函数:{check_fucn.__name__}")
														
--- a/gpt/get_article2.py
+++ b/gpt/get_article2.py
@@ -1,6 +1,6 @@
 
															 # -*- coding: utf-8 -*-
														
 
															-from gpt.chatgpt import get_answer_from_gpt,get_article_gpt_pydantic
														
 
															+from gpt.chatgpt import get_answer_from_gpt, get_article_gpt_pydantic
														
 
															 from gpt.gpt_check import CheckGptAnswer, CheckArticleResult
														
 
															 from tools.new_mysql import MySQLUploader
														
 
															 from tools.loglog import logger, log_err_e
														
@@ -11,7 +11,7 @@ from common.split_text import split_text_to_word
 
															 from pydantic import BaseModel
														
 
															 from cachetools import TTLCache
														
 
															 from concurrent.futures import wait
														
 
															-from random import randint, shuffle
														
 
															+from random import randint, shuffle, sample
														
 
															 import json
														
 
															 import requests
														
 
															 from openpyxl import load_workbook
														
@@ -202,6 +202,7 @@ class GetArticle:
 
															 3.文章中使用提供单词，一定要和提供单词的中文词义匹配，尤其是一词多义时，务必使用提供单词的词义。必须要用提供单词的词义。如果用到的词义与提供单词词义不一致，请不要使用这个单词。
														
 
															 4.生成的文章要求{select_word_count}词左右，可以用{no_escape_code}字符分段，一般{select_paragraph_count}个段落左右。第一段是文章标题。
														
 
															 5.生成文章优先使用[单词组1]的词义，其次可以挑选使用[单词组2]的词义。允许不使用[单词组1]的个别单词，优先保证文章整体意思通顺连贯和故事完整。
														
 
															+6.注意回复字段的中英文，englishArticle是英文，chineseArticle是中文，其中trunk是英文，analysis是中文，text是英文。
														
 
															 提供[单词组1]：{core_words_meaning_str};
														
 
															 提供[单词组2]：{extend_words_meaning_str};
														
@@ -213,7 +214,7 @@ class GetArticle:
 
															             r_json = json.loads(get_article_gpt_pydantic(q, temperature=0.9, real_ip=real_ip, demo_name=demo_name, model='gpt-4.1',
														
 
															-                                                 max_tokens=4000, sys_prompt=sys_prompt))
														
 
															+                                                         check_fucn=CheckArticleResult.get_article_1, max_tokens=4000, sys_prompt=sys_prompt))
														
 
															             allWordAmount = 0
														
 
															             allWordAmount += len(split_text_to_word(r_json["englishArticle"]))
														
@@ -244,12 +245,23 @@ class GetArticle:
 
															             r_json["body"] = r_json.pop("englishArticle")
														
 
															             r_json["chinese"] = r_json.pop("chineseArticle")
														
 
															+           
														
 
															+            for q in r_json['questions']:
														
 
															+                data = q['candidates']
														
 
															+                shuffled_candidates = sample(data, len(data))
														
 
															+
														
 
															+                labels = ['A', 'B', 'C', 'D']
														
 
															+                for index, candidate in enumerate(shuffled_candidates):
														
 
															+                    candidate['label'] = labels[index]
														
 
															+                q['candidates'] = shuffled_candidates
														
 
															+
														
 
															             return {**r_json, "allWordAmount": allWordAmount}
														
 
															         except json.decoder.JSONDecodeError:
														
 
															             logger.error("gpt生成文章回复json格式化错误")
														
 
															             raise
														
 
															         except Exception as e:
														
 
															-            logger.error(f"gpt生成文章回复其他错误.{type(e).__name__} {e}")
														
 
															+            log_err_e(e,f"gpt生成文章回复其他错误.")
														
 
															+
														
 
															             raise
														
--- a/gpt/gpt_check.py
+++ b/gpt/gpt_check.py
@@ -85,6 +85,16 @@ class CheckArticleResult:
 
															         if not all(i in json_object for i in ["englishArticle","chineseArticle","difficultSentences","usedMeanIds","questions"]):
														
 
															             return False
														
 
															+       
														
 
															+        try:
														
 
															+            for question in json_object['questions']:
														
 
															+                analysis = question['analysis'] 
														
 
															+                words_count_pct = len(re.findall(r"[a-zA-Z\']+", analysis))/len(analysis)
														
 
															+                if words_count_pct>0.5:
														
 
															+                    return False
														
 
															+        except:
														
 
															+            return False
														
 
															+
														
 
															         return True
														
 
															 if __name__ == '__main__':
														
--- a/mock/mock_request.py
+++ b/mock/mock_request.py
@@ -123,7 +123,7 @@ def get_article2_1():
 
															                                   {'spell': 'waste', 'meaning': '浪费, 荒芜, 废物', 'word_id': 1160701, 'meaning_id': 1292},
														
 
															                                   {'spell': 'environment', 'meaning': '环境, 外界', 'word_id': 873514, 'meaning_id': 1293},
														
 
															                                   {'spell': 'memory', 'meaning': '记忆, 记忆力, 回忆', 'word_id': 981104, 'meaning_id': 1294}],
														
 
															-                 'take_count': 1, 'student_stage': 3, 'demo_name': '春笋英语',"article_difficulty":1500}
														
 
															+                 'take_count': 1, 'student_stage': 3, 'demo_name': '春笋英语',"article_difficulty":800}
														
 
															     r = requests.post(f"{use_address}/article/reading-comprehension", json=json_data)
														
 
															     r_json = r.json()