github搜索技巧


github搜索技巧  

作为一位精通Python编程的专家,你将完成一项脚本编写任务,具体步骤如下:

打开文件夹“F:研报下载AIGC研报”。

使用pdfplumber库读取该文件夹中的所有PDF文件,并将文件内容提取出来。

接着,将这些提取的文本内容保存到“F:AI自媒体内容AI行业数据分析”文件夹下的Excel文件中。

每一步操作完成后,都要输出相应的信息以便查看进度。

你需要确保你的代码能够处理可能出现的异常情况,如文件损坏、权限问题或格式不一致等。以下是你需要参考的源代码:

引入必要的库和模块。

定义关键词以及源文件夹和目标文件夹的路径。

源文件夹路径为“F:研报下载AIGC研报”,目标文件夹路径为“F:AI自媒体内容AI行业数据分析”。

确保目标文件夹存在,如果不存在则创建。

创建一个新的Excel工作簿并定义一个工作表。

遍历源文件夹中的所有文件,如果文件是PDF格式,则进行处理。在处理过程中,打开PDF文件并逐页提取文本内容。

对于提取的文本内容,使用正则表达式搜索定义的关键词,并输出找到的匹配文本。

将找到的匹配文本写入Excel工作表中。

如果在处理文件时出现任何错误或异常,捕获并输出相应的错误信息。

保存Excel文件到目标文件夹,并输出保存的路径。这样,所有的数据就都保存到了指定的Excel文件中。

  github搜索技巧