做一个只针对一个EXCEL文件的搜索软件?

    为避免误会,首先声明本文前提是有合法访问身份,博文利用校园网包库形式进行登陆。PS:如果有人想问有没有外网免费访问方式呢?答案:有。请社工,然后SSL,当然这是不合情理的请大家别用,该话题点到为止,接下来转入正题。

中国知网是目前国内最大最全的综合期刊网,也是专家学者使用量最大的专业学术网站。由于近期的大研究任务需要对某杂志特定按年份进行梳理,而且第一个子任务只关心论文题目,还要保证千万不能出现作者或作者单位这样有可能影响我们判断的因素。因此,如何搜索、如何可仅得到论文题目,然后处理成格式正确可统计处理的Excel表,这便是本博文的内容。

    当然,第一步就是进入期刊网,并选择“来源期刊检索”,设置年份,进行搜索:

    选择你想要的文献,再点击“导出、分析...”进入下图:

    接下来,很简单,全选后点击“导出/参考文献”,如上图所示。在随后出现的页面中,仍然要进行几步操作:,虽然具有复制到剪切板功能,但通过我的验证这个功能目前截止发稿时无法使用。

    然后,打开这份TXT文件,把里面的所有内容复制到Excel中,如下图所示:

    当然,这并不是我们最后想要的格式,于是我们应该做两件事:一是把“Title题名”去掉,二是把空行去掉。具体做法如下:

    用快捷键Ctrl+F弹出“查找和替换”,全部替换即可,注意替换为选项内容为空。

    紧接着,选中A列,在数据选项卡中点击“删除重复项”,随后弹出的对话框直接确定就好。

    由于删除的是重复空行,因而第一个空行并未视作重复项,才保留了下来。将其删除掉。

    至此,全部完成,得到了只有论文名的Excel表!希望对大家有帮助。

我有一个从机器自动生成的文本文件。机器以“块”的形式写入txt文件(对不起,我不知道确切的术语)。我需要从这个txt文件中提取数据,但是我需要在从txt文件中提取数据之前完成它。我找到了一个解决方案来验证机器是否已经完成了对文件的写入...它不像我希望的那样优雅,但似乎做到了这一点。Excel VBA打开命令提示符,命令提示符使用Find命令查找字符串"End of Report"...这基本上是txt文件的最后几行之一,在找到它之后,假定txt文件已经完成,这是非常安全的。这段代码每10秒循环运行1000次,直到找到这个字符串或达到1000次尝试...

问题是,"result“除了返回"End of Report”之外,还会返回一些其他字符。事实上,我还试图在一些csv文件上运行此命令,这使情况变得更加复杂……"result“也返回一些额外的字符,但与txt文件返回的字符不同。例如,如果我检查“result”的长度...一个文件的长度返回为43,另一个文件的长度为48 ...我想它是在计算文件路径+“报告结束”+更多的字符?

不管怎样,我真的不需要“结果”...我真的只需要一个"true“/ "false”,如果"Find“找到"End of Report”或没有...我如何才能做到这一点呢?有没有其他更好的方法来做到这一点?我不熟悉命令提示符编程。

注意:搜索这些文件而不打开它们是很重要的。

我要回帖

更多关于 文件搜索软件哪个好 的文章

 

随机推荐