·您现在的位置: 云翼网络 >> 文章中心 >> 网站建设 >> 网站建设问答 >> 老Y文章管理系统采集自动伪原创详解

老Y文章管理系统采集自动伪原创详解

作者:佚名      网站建设问答编辑:admin      更新时间:2022-07-23

做垃圾站的站长们,最希望的事就是网站可以自动采集、自动完成伪原创、然后自动收钱,这实在是天底下最幸福的事,呵呵。自动采集和自动收钱就不讨论了,我今天介绍一下如何利用老Y文章管理系统采集时自动完成伪原创的方法。

老Y文章管理系统使用简单、方便,虽然功能不如DEDE之类的强大到几乎变态的程度(当然,老Y文章管理系统是asp语言写的,似乎也没有可比性),但是该有的都有,且相当简单,所以也受到了不少站长们的欢迎。老Y文章管理系统采集时自动完成伪原创的具体方法还很少有人探讨,在老Y的论坛上,甚至有人在卖这个方法,小小的鄙视一下。

关于采集,我就不多说了,相信大家都可以搞定,我要介绍的是老Y文章管理系统如何在采集的同时自动完成伪原创工作的具体方法,大体的思路就是利用老Y文章管理系统自带的过滤功能实现近义词的自动替换,从而达到伪原创的目的。比如我想将被采集文章中的所有“网赚博客”字样替换为“网赚日记”。详细步骤如下:

第一步,进入后台。找到“采集管理”-“过滤管理”,添加一个新的过滤项目。

我可以建立一个名为“网赚博客”的项目,具体设置请看图:

“过滤名称”:填入“网赚博客”即可,也可以随意写,但是为了方便查看,建议与被替换的词语一致。

“所属项目”:请根据自己的网站进行选择一个网站栏目(必须选择一个栏目,否则过滤项目无法保存)

“过滤对象”:可选项有“标题过滤”和“正文过滤”,一般选“正文过滤”即可,如果你连标题都想伪原创一下,可以选择“标题过滤”。

“过滤类型”:可选项有“简单替换”和“高级过滤”,一般选“简单替换”,如果选择了“高级过滤”,需要指定“开始标记”和“结束标记”,这样可对采集来的内容进行代码级的替换。

“使用状态”:可选项有“启用”和“禁用”,不用解释。

“使用范围”:可选项有“公有”和“私有”。选择“私有”,该过滤仅对当前网站栏目有效;选择“公有”,对所有栏目都有效,不管采集任何栏目的任何内容,该过滤均有效。一般选“私有”即可。

“内容”:填入“网赚博客”,将要被替换的词语。

“替换”:填入“网赚日记”,这样只要被采集的文章中含有“网赚博客”字样,就会被自动替换为“网赚日记”。

第二步,重复第一步的工作,直到添加完所有的近义词。

有网友要问了:我有30000多条近义词,难道要一条一条手动添加?那要到添加什么时候!?不能批量添加吗?

这个问题问得好!手动添加的确几乎是个不可能完成的任务,除非你有超常的毅力,可以手工把这30000多条近义词添加进去。遗憾的是,老Y文章管理系统并没有提供批量导入的功能。但是,作为真正的、资深的、有思想的懒人,我们要有懒人的觉悟。

要知道,我们刚才输入的内容,是存储在数据库中的,而老Y文章管理系统是用asp+Access写的,mdb数据库可以很方便的编辑!于是乎,我可以通过直接修改数据库的方法来批量导入伪原创替换规则!

改进的第二步:修改数据库,批量导入规则。

经过查找,我发现这个数据库位于“你的管理目录\cai\Database”下。用Access打开这个数据库,找到“Filters”表,你会发现我们刚才添加的替换规则就在这儿存着呢,根据你的需要,批量添加吧!接下来的工作涉及到Access的操作了,我就不罗嗦了,大家自己可以搞定。

解释一下“Filters”表中的几个字段的含义:

FilterID:自动生成,无需输入。

ItemID:栏目ID,就是我们手动输入时“所属项目”的内容,不过这里是个数字ID,注意跟栏目的采集ID做好对应,如果不知道ID,可以重复第一步,测试一下。

FilterName:即“过滤名称”。

FilterObjece:即“过滤对象”,填1为“标题过滤”,填2则是“正文过滤”。

FilterType:即“过滤类型”,填1为“简单替换”,填2为“高级过滤”。

FilterContent:即“内容”。

FisString:即“开始标记”,仅在设置了“高级过滤”时有效,如果设置了“简单过滤”请留空。

FioString:即“结束标记”,仅在设置了“高级过滤”时有效,如果设置了“简单过滤”请留空。

FilterRep:即“替换”。

Flag:即“使用状态”,TRUE为“启用”,FALSE为“禁用”。

PublicTf:即“使用范围”。TRUE为“公有”,FALSE为“私有”。

最后说一点利用过滤功能实现伪原创的使用感受:

老Y文章管理系统的这个功能可以实现采集时自动伪原创,但是功能还不够强大。比如我站上有“栏目一”、“栏目二”、“栏目三”共三个栏目。我希望“栏目一”对标题和正文都进行伪原创,“栏目二”只对正文进行伪原创,“栏目三”只对标题进行伪原创。

于是,我只能做如下设置(假设我有30000的近义词规则):

为“栏目一”的标题伪原创创建30000条替换规则;

为“栏目一”的正文伪原创创建30000条替换规则;

为“栏目二”的正文伪原创创建30000条替换规则;

为“栏目三”的标题伪原创创建30000条替换规则。

这样就造成了极大的数据库浪费,如果我的站有几十个栏目,每个栏目的要求都不一样,这个数据库的尺寸将会十分恐怖。

所以建议老Y文章管理系统下一版本将这个功能做一下改进:

首先添加批量导入功能,毕竟修改数据库有一定的危险性。

其次,过滤规则不再依附于某个网站栏目,而是将过滤规则独立出来,而在建立新的采集项目的时候,加入一条是否使用过滤规则的判断。

相信,这样修改之后可以极大地节约数据库存储空间,同时逻辑结构也显得更加清晰。

本文为“我的网赚日记-原创网赚博客”原创,请尊重我的劳动成果,转载请注明出处!另外,我使用老Y文章管理系统时间并不是很久,如果文中有错误或不当的地方,欢迎大家指正!