github搜索技巧

作为一位精通Python编程的专家,你将完成一项脚本编写任务,具体步骤如下:
打开文件夹“F:研报下载AIGC研报”。
使用pdfplumber库读取该文件夹中的所有PDF文件,并将文件内容提取出来。
接着,将这些提取的文本内容保存到“F:AI自媒体内容AI行业数据分析”文件夹下的Excel文件中。
每一步操作完成后,都要输出相应的信息以便查看进度。
你需要确保你的代码能够处理可能出现的异常情况,如文件损坏、权限问题或格式不一致等。以下是你需要参考的源代码:
引入必要的库和模块。
定义关键词以及源文件夹和目标文件夹的路径。
源文件夹路径为“F:研报下载AIGC研报”,目标文件夹路径为“F:AI自媒体内容AI行业数据分析”。
确保目标文件夹存在,如果不存在则创建。
创建一个新的Excel工作簿并定义一个工作表。
遍历源文件夹中的所有文件,如果文件是PDF格式,则进行处理。在处理过程中,打开PDF文件并逐页提取文本内容。
对于提取的文本内容,使用正则表达式搜索定义的关键词,并输出找到的匹配文本。
将找到的匹配文本写入Excel工作表中。
如果在处理文件时出现任何错误或异常,捕获并输出相应的错误信息。
保存Excel文件到目标文件夹,并输出保存的路径。这样,所有的数据就都保存到了指定的Excel文件中。
