AI使用
- deepseek(非 R 型)很适合处理文本,pdf转文本后进行校对
import pdfplumber
with pdfplumber.open("夜行6fin.pdf") as pdf:
total_pages = len(pdf.pages)
n = 10 # 指定分割数量
pages_per_file = total_pages // n # 每份文件的页数
for i in range(n):
start_page = i * pages_per_file
end_page = (i + 1) * pages_per_file if i < n - 1 else total_pages
text = ""
for page in pdf.pages[start_page:end_page]:
text += page.extract_text() + "\n"
# 文件名按数字命名(如 output_1.txt, output_2.txt ...)
with open(f"output_{i+1}.txt", "w", encoding="utf-8") as f:
f.write(text)
print(f"按页数均分完成:output_1.txt 到 output_{n}.txt")
每份单开一个对话,输入提示词:帮我校对一下这段文本,哪些地方词法和语法需要修改,写出需要修改的地方。 不用管断续的武 大 推 协和珞珈文创、页面等,这些是转换格式上的问题