文档库 最新最全的文档下载
当前位置:文档库 › 2019年织梦DedeCms采集规则教程

2019年织梦DedeCms采集规则教程

2019年织梦DedeCms采集规则教程
2019年织梦DedeCms采集规则教程

2019年织梦DedeCms采集规则教程

篇一:DEDECMS完整采集教程(共三篇)

DEDECMS完整采集教程(列表设置篇)-marco608原创以的html教程中的数据库为例,地址是

/web-art/htmlbase/HTML/index.html

一,打开dedecms,进入【采集节点管理】,新建一个节点,模型我们就选择

-------------------------------------http://hi.baidu./44108 28----------------------------------------

二,填写节点的基本信息:

名称就自己定义吧。

编码就比较重要,大家可以在页面点击右键来看该页面的编码。

来源就自己定义吧。

防盗链就看目标站点的有无刷新限制,有就设置一下超时时间。

-------------------------------------http://hi.baidu./44108 28----------------------------------------

三,设置采集列表:

我们要采集的列表是这样的:

而我们要设置的列表是这样的:

下面我们来说明一下这个设置是怎么填的。

来源网址很重要的。列表的获取就是从这里得到的。

自己打开:/web-art/htmlbase/HTML/list_33_2.html看看分页的规律。不难看出吧?

然后我们在设置列表分页时,就转换为变量值的形式:

/web-art/htmlbase/HTML/list_33_[var:分页].html

而变量起始值是1,结束值是3,就代表1至3的列表页了。

正则配置网址就看本身是否有比较特定的文章网址字符。例如page1.html之类的。

下面的html范围就比较重要。

我们看原dede的列表。我们在浏览器里查看源文件。

查找以下代码:

看到这里,你一定要认识常用的html代码。

这里要复制代码起始就是那个文章列表的表格的开始部分吧。

下面就是文章列表的表格的结束部分的代码:

篇二:DeDeCMS5.7详细采集教程

DeDeCMS织梦的采集教程,超级详细

超级详尽的织梦采集教程

看到很多网友都为织梦(DEDECMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会首先我们打开织梦后台点击采集——采集节点管理——增加新节点

这里我们以采集普通文章为例,我们选择普通文章,然后确定

我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。

一、设置文章列表页面

然后打开你想要采集的文章列表页,这里我们以织梦官网为例

/web-manage/jianzhanxinde/打开这个页面,右键——查看源文件

找到目标页面编码,就在charset后面

页面基本信息其他的一般就不用管了,填完了如图

现在我们来填写列表网址获取规则看看文章列表第一页的地址

/web-manage/jianzhanxinde/list_49_1.html

对比第二页的地址/web-manage/jianzhanxinde/list_49_2.html 我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写/web-manage/jianzhanxinde/list_49_(*).html就是把1换成了(*)因为这里只有2页,所以我们就填从1到2每页递增当然是1了,2-1...是等于1吧

这里我们就填写完了

-------------------------------------------------------------------------------------------------------------

没有规则的路径,需要手动设定

可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图

每行写一个页面地址

--------------------------------------------------------------------------------------------------------------

列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页右键查看源文件找到区域开始的HTML,就是找文章列表开始的标志。

我们很容易的找到了如图中的“新闻列表”。从这里开始,后面就是文章列表里我们再找文章列表结束的HTML

就是这个了,一个很容易找到的标志

如果链接中含有图片:

不处理采集为缩略图这里根据自己的需要选择

对区域网址进行再次筛选:(使用正则表达式)

必须包含:(优先级高于后者)

不能包含:

打开源文件,我们可以很清楚的看到,文章链接都是以.html结束的

所以,我们在必须包含后面填.html如果遇到有些列表很麻烦,还可以填写后面的不能包含

实例如图

二、设置文章内容采集

我们点击保存设置进入下一步,可以看到我们获得的文章网址

看到这些就是对的了,我们保存信息进入下一步设置内容字段获取规则

我们看看文章有没有分页,随便进入一篇文章看看。。我们看到这里的文章没有分页所以这里的我们就默认了

我们现在来找文章标题等等随便进入一篇文章,右键查看源文件看看这些

依照源码填写

我们再来填写文章内容的开始,结束和上面的一样,找到开始和结束标志

篇三:dedecms采集规则

dedecms采集规则dedeCMS采集规则,过滤,替换文章内的部分内容

1.采集去除链接

[Copytoclipboard]CODE:

{dede:trim}]*)>([^

--------------------------------

让field:title标题突破30这个长度,修改代码的方法

找到./include/inc_arcpart_view.php

行291:

if($titlelen=="")$titlelen=30;

修改为

if($titlelen=="")$titlelen=60;

就可以了,然后,你可以这样调用了

{dede:channelArtlisttypeid='0'col=1tablewidth='100%'} {dede:arclistrow="10"}

[field:titlefunction="cn_substr('@me',38)"/]

{/dede:arclist}

{/dede:channelArtlist}

把这个延伸一下:关于inc_arcpart_view.php

functionGetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$i nfolen=160,

$imgwidth=120,$imgheight=90,$listtype="all",$orderby="defau lt",$keyword="",$innertext="",$tablewidth="100",$arcid=0,$i dlist="")

这里的参数都可以更改你实际需要的模板元素尺寸大小.

2.采集过虑中去掉链接保留文字的方法!

柏老大的方法是{dede:trim}]*)>([^<]*){/dede:trim}

这样做会去掉与之间的字符!这样整个文章就少了部分字符,不完整了!

后来我多次测试,总算找到了正确的使用方法!如下:

{dede:trim}]*)>{/dede:trim}

{dede:trim}{/dede:trim}

做成两条采集规则就可以了!

在实际使用中好像([^]*)两条一起使用才行!

3.过滤div

{dede:trim}]*)>{/dede:trim}

{dede:trim}

{/dede:trim}

过滤js

{dede:trim}]*)>([^

过滤变量字符

固定(.*)固定

4.dede万能过滤代码

以下是常用的正则表达式标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}

{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}

以下为不常用的正则表达式标签

{dede:trim}{/dede:trim}

{dede:trim}

{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}

{/dede:trim}

{dede:trim}{/dede:trim}

{dede:trim}

{/dede:trim}

{dede:trim}{dede:trim}

{dede:trim}{dede:trim}

{dede:trim}{/dede:trim}

/////////////////////////////////////

5.织梦标题不全,鼠标指向显示全部的代码:

{dede:arclisttitlelen='100'}

[field:titlefunction='(strlen("@me")>40?cn_substr("@me",40) :"@me")'/]

{/dede:arclist}

6.dede/inc/inc_archives_functions.php第100行(flash频道

远程flash本地化的BUG)$cfg_uploaddir=$GLOBALS['media_dir'];

修改成

$cfg_uploaddir=$GLOBALS['cfg_other_medias'];

6.发布时间,来源,作者可以通过@me函数实现,如:在自定义

处理接口:处输入@me="Azure·【博】"就表示来源为“Azure·【博】”

7.内容的替换:在所采集的文章内容中有多媒体,使用的是相对

路径,采集的时候又不想下

载,最好的办法就是将地址替换成媒体的实际地址。可以这样实现,在文章内容规则部分的自定义处理接口:处输入

@me=str_replace('src="str1','src="str2',@me);

这样采集出来的文章中的所有的str1就被替换成str2!

DedeCMS专题功能使用详细教程

爱雅逸整理 https://www.wendangku.net/doc/c517553598.html,
DEDECMS 专题详解
DEDECMS 专题详解
一个网站通常会在不同时期推出一些针对性的专题内容,专题的功能其实就是将站点的内容根据特 定的需求进行一次检索,将这些不同形式的内容进行一次整合,这个我们可以看看一些大的门户网 站,例如新浪、搜狐,他们有自己的专题频道。一个专题可以包含几个不同栏目的内容或者包含不 同内容模型如:文章、图片、音频、视频等,不同的专题需要有自己符合当时环境的页面风格,比 如在元旦、新年就需要红色主题的专题模板,在春天、夏天就需要绿色主题的专题模板等。一个好 的专题容易让网站会员更全面的了解相关信息,以增强对网站的关注度,下面我们介绍如何使用 DedeCMS 的专题功能来制作一个专题。 我们以超级管理员身份登陆后台,在系统的[核心]-[专题管理]中对专题进行管理。
因为这里的常用管理同文档管理类似,一些常用操作如添加、删除、更新、推荐这些操作在这里不 做冗述,本教程主要介绍如何通过专题结合模板文件制作出自己的专题页面。 制作一个专题页面,需要准备 2 样东西:内容、模板,当然如果你没有自己设计的模板文件,系统 默认是自带了一套专题页的风格的,可以在后台[核心]-[内容模型管理],点击专题类型的模板 会查看到以下内容:
文档模板:/templets/default/article_spec.htm [修改] 列表模板:/templets/default/list_spec.htm [修改] 频道封面模板:/templets/default/index_spec.htm [修改]
这几个默认模板文件用户可以自己进行全局统一修改,但一般情况下都是在添加专题时在常规参数 的“专题模板”中进行指定。 当然有一些专题也不必用到已经发布在内容管理系统中的内容,这种专题直接可以用静态页面就可 以完成,不需要标签进行调用,但又希望在专题列表中显示出来,为了解决这个问题,建议用户在 制作专题页时候把专题页面做成一个不含标记的模板文件,在添加专题时候指定模板即可。 接下来我们介绍下织梦的专题功能是如何划分的。 我们以 chinaz 两个专题页面为例: DedeCms V5.3 经典解析与揭秘(https://www.wendangku.net/doc/c517553598.html,/zt/dedecms/)
第 1 页共 6 页

DEDE织梦仿站实例系列教程(花钱培训自学最终整理完整版)_仿拳击网

DEDE织梦仿站实例系列教程第一讲——准备工作 首先,我们找一个目标网站,以便我们来仿制。 经过福星网络的寻找,确定以拳击在线(https://www.wendangku.net/doc/c517553598.html,)为目标站来完成织梦模板的仿制教程。 其次,关于以后教程的一些说明: 1、将目标站网页另存为,会得到一个网站,及相关的文件夹。里面有相关的图片,样式和JS文件。我们需要将这些文件复制到织梦模板的相关文件夹下。在这个系列教程中,此文件夹为templets\fuxing5。 2、我们会制作一个通用的头部和底部,以便全站调用。所以我们会优先制作头部和底部。 3、朋友们需要有HTML知识,还有DIV+CSS的一些知识才行。 4、不断更新。。。 最后,希望朋友们跟着我们一步一步的做,学会织梦的仿站。呵呵,别人的教程可是收费的哦! DEDE织梦仿站实例系列教程第二讲——首页框架 首先,打开目标站拳击在线(https://www.wendangku.net/doc/c517553598.html,),然后将网页保存到本地。如图:

保存类型选择网页,全部(*.htm;*.html)。如下图所示: 将织梦(DEDECMS)的默认模板文件夹复制一份,以备做在模板制作时做为代码参考。 然后打开保存文件夹,如下图中箭头所指的文件夹: 将文件夹中的文件归类,将CSS文件拷贝到templets\default\style目录下,将JS文件拷贝到templets\default\js,将图片文件拷贝到templets\default\images。 接着用网页编辑器软件FrontPage或者Dreamweaver打开刚刚保存的拳击在线网页文件和templets\default目录下的index.htm(首页)、head.htm(通用头部)、footer.htm(通用底部)。还要打开刚刚备份的默认模板首页文件templets\复件default\index.htm。 先清空index.htm文件,将拳击在线网页代码拷贝到里面。 接下来,就是正式的代码修改了。一行一行的来修改。 首先将CSS样式表的路径修改成织梦的CSS路径代码(从备份的默认首页文件中拷贝),如下图所示:

DEDECMS织梦制作手册超详细

D E D E C M S织梦制作手册 超详细 Document serial number【NL89WT-NY98YT-NC8CB-NNUUT-NUT108】

DEDECMS模板制作教程 1.Arclist 标记的应用,使用率很高,相当实用,所以我们使用都必须熟练掌握。 2.Field标记在封面模板、列表模板、文档模板的使用频率很高,实用。主要用来获得到系统变量的值或者路径,用法很灵活。可以直接展示数据,如调用position,得到栏目一 > 栏目二”这样形式的链接;或者,调用templeturl得到/templets这样路径。 3.Channel 标记主要用于获取栏目列表,用法非常简单,主要是区分“type = top,sun/son,self ”的所调用的对象就行了。 4.Type标记表示指定的单个栏目的链接,用法非常简单。 5.Autochannel标记使用实例 6.Mytag标记使用实例板中多次出现的相同元素用一个自定义标记表示出来,从而达到,一次更改,全局更换的效果。辅助插件的广告管理也有相似的效果。 7.Type标记用于获取一组投票表单。其使用范围限于:封面模板。 8. Flink 标记使用实例用于获取友情链接。调用该标记后可以得到四种友情链接的形式。 9.Mynew标记使用实例用于获取站内新闻。站内新闻有利于站长及时与会员沟通。 10.ChannelArtlist标记使用实例用于获取当前频道的下级栏目的内容列表。该标记在封面模板(包括主页)中的经常被用到 11. List 标记使用实例 12.Pagelist 标记使用实例 13.Pagebreak标记使用实例 14.Prennext标记使用实例 15.Pagetitle标记使用实例 模板教程【Arclist 标记使用实例】(一) Arclist标记的使用思路、步骤: 一、明确使用范围 我们在使用任何标记的过程中,都必须明确其使用的范围,否则可能无法正常调用该标签,【Arclist 标记】的使用范围是: 封面模板、列表模板、文档模板。 即对应templets\default\文件夹下的 index_识别模板、list_识别模板、article_识别模板) 二、通过调试了解其使用方法 我调试的方法是: 将templets\default\文件夹下的文件代码,全部掏空。放入调用【Arclist 标记】的代码,再在IE 中访问网站主页,就可以得到返回的数据。 注意:其它文件保持不变,我不懂PHP,只能用这种方式调试,相信朋友们很容易上手的。 我调试【Arclist 标记】的具体代码如下: {dede:arclist typeid='' row='1' titlelen='20' infolen='' imgwidth='100' imgheight='80'} 文章ID:[field:ID/]
文章标题:[field:title/]
文章短标题:[field:shorttitle/]
文章标题的文字链接:[field:textlink/]

织梦采集规则

茂名门户:https://www.wendangku.net/doc/c517553598.html,茂名Seo:https://www.wendangku.net/doc/c517553598.html, 织梦采集规则 一个大型的资讯网站,频道N多,网站数据也N多,不可能每一条数据都是由网站管理员一条条的来发的!这时候,为了节约人力物力,采集器就诞生了(做优化的朋友,笔者可不推荐你们使用哦)!下面,笔者就用织梦管理系统自带的采集器来采集一个网站的数据给大家演示一下,采集规则是怎么写的! 步骤一:新建一个文章采集节点 1、登录织梦管理后台,依次点击 2、采集>>采集节点管理>>增加新节点>>选择普通文章>>确定 步骤二:填写采集列表规则 1、节点名称:随便(注意你要能分清哦,因为节点多了的话,有可能会搞得自己混 乱) 2、目标页面编码:看目标页面的编码(比如我采集的网站的编码就是GB2312) 3、匹配网址:去到采集目标列表页面,查看它的列表规则!比如说很多网站的列 表的第一面跟其它内页是有很大的差别的,所以我一般不采集目标列表的第一 页!比如说我演示的网站的列表规则是第一页设定一个默认的首页,看不到后 面的实际路径的,如图:

茂名门户:https://www.wendangku.net/doc/c517553598.html,茂名Seo:https://www.wendangku.net/doc/c517553598.html, 所以,我们只能从第二页开始(虽然可以找出第一页,但很多的网站是根本没 第一页的,所以,这里就不说怎么找第一页了),!我们来对比一下,采集目标 页的第二页跟第三页!如图: 可以看到,这两页都是有规律的递增的,第二页就是list_2!第三页就是list_3! 所以,匹配网址我们就写成 上面那个(*)代表的就是列表页面的2,或3,或4,或更多!而第三条横杆那 里,我写了个(*)从 2 到 5 ,这里表示的是,把2到5,每次+1的增加, 匹配至(*)里面,代替(*)! 4、区域开始的HTML:在采集目标列表页打开源代码!在要采集的文章标题前面 的附近找一段在本页是唯一并且其它要采集的的页面也是唯一的html标签!

流量站养站操作教程,爬虫SEO养站教程

流量站养站操作教程,爬虫SEO养站教程 要做好采集站,前提就必须做好内容处理,内容处理就离不开搜索引擎已经有的内容,在搜索引擎上的内容处理,是很多采集站站长最头疼的之一;一般采集站都离不开采集工具,一个好的内容采集处理工具,对于采集站来说是重中之重! 一、采集站必备 1.老域名 2.符合搜索引擎的网站程序 3.采集工具 4.快排点击 做采集站一个好的老域名是不可少的,什么样的老域名才是好的域名呢? 1.老域名的评级(DR) 2.老域名的外链数 3.老域名的反向链接 4.老域名的历史外链 5.网站的前身历史快照查询 以上数据桔子SEO,都可以查到! 市面上有许多CMS程序,比较常见的常用织梦、帝国、WordPress、ZBLOG等,选择着选择什么程序因自己而定。 采集工具

市面上的SEO采集工具很多,比如:火车头、八爪鱼、简数采集、后羿采集、采集侠、采集节点等,用的比较多是火车头。 1、火车头 对于seo人员来说,火车头就是一款比较常用的采集软件了。下载安装火车头采集器,有付费与免费版,百度查找下载地址。 2、八爪鱼 八爪鱼采集器是用于快速网页信息采集的工具,常用来采集网站文章、网站信息数据等。八爪鱼有免费的版本,也有收费版本,这个的话就要根据自己或者公司的需求了,免费版在很多方面被限制。 3、简数采集 简数采集是完全在线使用的采集器,不需要安装客户端,功能强大,操作简单,很多地方都有默认的配置。另外还有强大的SEO工具和数据批量处理工具,采集的数据也可以很快捷的发布到各个开源CMS系统。简数采集有免费的版本,免费版从采集到发布的主线功能都覆盖到了。 4、后羿采集 这款采集工具比较智能,需要人配置的地方很少,可以算是傻瓜式操作的软件了。 织梦程序采集插件: 5、采集侠 使用采集侠的插件,网站必须是织梦的,因为这个插件是织梦的采集插件。采集侠是直接通过关键词采集文章,采集侠是一款收费的软件,当然我们也可以下载破解版的,具体可以百度搜。 6、采集节点 织梦采集节点是织梦后台程序自动带的,采集节点是完全免费的,但是采集并不是很强大,有很多东西无法实现。 不过随着python的到来,现在市面上也有相对多地站长,开始用爬虫python来采集来处理内容,这个对于大部分会程序站长来说不难! 比如站长本人就是用python写的采集程序,同时可以处理[标题]与[内容],相当的方便智能。

火车头LocoySpider发布模块制作(dede5.7)图文教程

火车头发布模块制作(dede5.7)图文教程 说明:为方便大家更好的学习和掌握火车头采集器((LocoySpider)自定义发布 模块的制作,本人通过火车头采集器((LocoySpider)安装配置教程以具体的实例用图文教程的方式全面介绍火车头采集器((LocoySpider)自定义发布模块的制作的方法和技巧,方便大家学习和使用。如果有兴趣登陆可视教程论坛在线学习和观看火车头采集器((LocoySpider)自定义发布模块的制作入门到精通视频教程. 本文以图文方式全面详细介绍火车头采集器((LocoySpider)为dede5.7量身制作自定义发布模块。 一、打开抓包工具Fiddler2汉化版 二、打开ie,登陆https://www.wendangku.net/doc/c517553598.html,/dede/后台 用管理员登陆dede后台。抓包工具有如下数据:

找到其中的login.php文件:如下 上图右边红框内容如下: POST https://www.wendangku.net/doc/c517553598.html,/dede/login.php HTTP/1.1 Host:https://www.wendangku.net/doc/c517553598.html, User-Agent:Mozilla/5.0(Windows NT6.1;WOW64;rv:28.0)Gecko/20100101Firefox/28.0 Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language:zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3 Accept-Encoding:gzip,deflate Referer:https://www.wendangku.net/doc/c517553598.html,/dede/login.php?gotopage=%2Fdede%2Findex.php Cookie:menuitems=1_1%2C2_1%2C3_1%2C4_1;cyan_uv=C62149898D900001D7B51A6E683024D0; lastCid=3;lastCid__ckMd5=86ae82e846e9c1b1; ENV_GOBACK_URL=%2Fdede%2Fmychannel_main.php;PHPSESSID=v806m80pcefgmsmgvlcgao5u66 Connection:keep-alive Content-Type:application/x-www-form-urlencoded Content-Length:106 gotopage=%2Fdede%2Findex.php&dopost=login&adminstyle=newdedecms&userid=admin&pwd= hncctv&validate=rug1&sm1= 三、打开火车头,并新建发布:设置网站自动登陆

织梦采集侠V2.6破解版完美破解详细操作教程

https://www.wendangku.net/doc/c517553598.html,/credits-download?invite=5261 看着很多,其实很简单。只是我怕有的朋友不大懂,所以写的比较详细。用过的不用看都会操作。新手请仔细看下面教程,不要着急,一步步的来就可以 https://www.wendangku.net/doc/c517553598.html,/video.html#view 按上述教程安装好后覆盖破解文件 1:先安装官方试用版 原始文件下载地址 下载地址:https://www.wendangku.net/doc/c517553598.html,/credits-download?invite=5261 (记得,原始文件一定要是从这里下载的,别的地方因为版本原因没有用的。) https://www.wendangku.net/doc/c517553598.html,/kay.html#cdkay 按上述教程安装好后覆盖破解文件 2:如果你的程序是GBK版的(在网站后台的顶部仔细找下,可以看到GBK或UTF-8) 就在FTP 你的网站根目录左边点进破解文件GBK版FTP右边在你网站的根目录把dede和Plugins这2个文件夹覆盖到你的网站根目录 (如果你的织梦程序后台目录名不是dede,那就把dede改名成你后台目录名再覆盖) 一般情况后台目录都是dede不用改 (也就是覆盖相应的破解文件了,使用过的人都知道怎么弄的!) 3:相应覆盖完后在后台模块-采集侠-高级设置那如果提示你输入序列号 输入方法: 授权码任意输入!!记住大于8位任意数字字母组合!!! 出现授权错误话关闭游览器更新游览器缓存然后重新打开再设置再提示错就换个核心游览器就可以了。 4:设置触发采集采集侠所谓的自动采集就是触发采集即: 设置好触发条件后有人点击你的网站就会触发一会采集一会如果网站流量稳定就会一直采集自己点别人点都可以 设置方法:采集任务下面有段话就写了方法,不会找的我这里再说下: 把{dede:robot copyright="qjpemail"/} 这段代码加到模板-默认模板管理-footer.htm最下面,然后生成全站,就设置好了有人点击或自己点击自己的网站就会自动采一会了一般我都是设置关键字或者用RSS 采集RSS可以在百度搜:RSS地址会找到很多也比较方便。可以定向采一个网站 警告!!!!!!!!!!!!!!!!!!!!!!!!!!!! 经通过淘宝购买其他破解版的一些站长们证实:部分经过解密的破解版采集侠留有后门,填写授权码形式为https://www.wendangku.net/doc/c517553598.html,|78250688, 其中78250688为破解作者的QQ号,当你授权通过的时候,也会将你的站点信息收集并发送到作者的QQ邮箱!通过插件注入拿站! 这个版本经过解密的改写,修正了这个问题,经过修改的织梦采集侠破解版授权的时候只需

织梦建站系列教程

织梦建站系列教程:安装篇 今天将要向大家介绍的是如何快速安装织梦CMS及后台管理功能简介。 一、环境配置 织梦CMS是一款在PHP和MYSQL环境下运行的程序,无论是在网络空间上还是在本机上运行 织梦CMS都需要这个环境的支持,所以学习织梦建站之前我必须先完成环境的配置。如果你要 在网络空间里安装织梦程序,请咨询空间,是否支持。我这里主要介绍下如何快速搭建本地环境。完成本地环境的搭建,我们需要下载APMSERV这个软件。(点此下载APMServ5.26) 1、下载完成后,我们可以看到APMServ5.26是一个7zip自解压文件,是一个绿色安装包,我们 将其解压到我们的硬盘里就可以使用了,这里我们要注意一点:由于APMServ5.26程序不能识 别非英文字符的路径,所以请我们解压时注意选择英文路径,例如:E:\APMServ5.26)。解压 完成后我们打开程序目录找到APMServ.exe双击运行。打开界面如下:

2、点击“启动APMServ”,注意状态栏一定提示Apache、mysql启动成功才表示启动成功。 (提示:如果无法启动,可能是被迅雷、PPLIVE等软件占用了80端口,你可以关闭80端口 或将Aphache端口改为其它的,比如:8080。) 3、点击右上角的访问本地网站或运行http://127.0.0.1,运行http://127.0.0.1/phpinfo.php可 查看php组件运行情况。到这里为止我们的Aphache+php+Mysql运行情况就架设好了。二、安装织梦CMS程序 当我们完成本地环境配置后,我们就可以安装织梦CMS程序了。请大家下载一个织梦CMS 程 序,官方最新版本为V5.5。(点此下载织梦V5.5) 1、下载完成后,请大家将程序解压出来,你发现有一个uploads文件夹,请大家打开这个文 件夹,然后把所有的文件复制到APMServ5.26程序目录下的htdocs文件夹下。(例如E:\APMServ5.2.6\www\htdocs) 2、请大家现运行http://127.0.0.1看看,应该会出现织梦CMS的安装界面了。

寂寞天涯的教程织梦dedecms 自己制作标签教程

首先我简单的介绍下自己,我是织梦官方团队的天涯,接触织梦也有2年多时间了,之前一直在论坛上做斑竹,认识了很多喜爱织梦的朋友,后来便加入了织梦团队,发现这是一个充满朝气、有激情和学习力的地方,这次受站长网的邀请来给大家做一次DedeCMS程序方面的讲座。 因为这次主要是讲座,缺乏体系的培训内容,本次讲座我将织梦技术论坛较为常见的问题加以整理,并结合一些其他方面的应用内容进行补充,让大家更了解DedeCMS程序的使用。 安全设置 首先是程序安全问题,这里主要是一些拥有独立服务器的站长,如果自己在系统安全部署上面有些经验那应该没有什么问题,有部分站长没有系统安全部署的经验,加上现在挂马猖獗,所以许多人都在担心,官方在早些时候就发了一个关于《DedeCms V5.3/V5.5 安全设置指南》的主题帖,地址为: https://www.wendangku.net/doc/c517553598.html,/172474.html,这里面说了如何在Win Serv环境配置服务器环境。 不过文中提到了织梦的文件目录,这里我对整个系统文件目录进行一个说明: https://www.wendangku.net/doc/c517553598.html,/178324.html,当然,如果你安装个模块会相应的增加一些目录,例如模块group、ask等。 {dede:sql}标签的用法 sql标签可以称得上是个万能标签了,查询数据库将其输出,这里介绍一些关于这个标签的用法: 1.用来输出统计内容,这个是不错的,举个例子,我们来统计下总共发了多少的文章,思路就是输出dede_addonarticle这个文章附加表内容总数就可以了。 {dede:sql sql="SELECT COUNT(*) AS nums FROM dede_addonarticle"} [field:name = "nums"/] {/dede:sql} 2.使用~field~来进行特殊的查询,比如之前论坛上面很多会员需要做一个输出当前发布文章会员的相关内容,之前用sql或者arclist标签是没办法实现的,因为每篇内容是不同的,这里我们来用5.5的sql 语句来做个示范。 我们首先在文章模板中相应的位置加上下面的标签 {dede:sql sql="SELECT * FROM dede_archives WHERE writer=~writer~"} [field:id/], {/dede:sql} 这个放到article_article.htm页面,将会检索出当前会员发布的相关文章,这里的~ writer~会根据当前内容的环境变量进行替换后再执行查询。 这里出现在SQL语句中条件查询的~ writer~,也就是$refObj->Fields[$value]这个里面的相关内容 模板中使用PHP 许多人希望织梦的模板标签能够更加灵活,加入可以运行PHP的功能,这里在DedeCMS V5.5中就加入了一个可以执行php的特殊标签{dede:php}{/dede:php},这个标签可以执行PHP语句了。 我这里举几个常用的例子: 1.最简单的输出内容: {dede:php} $numA = 1;

火车头采集软件使用教程(图文版)

火车采集器V2010SP3版(实现内容自动更新的采集软件) 前提:本软件要求电脑安装net framework2.0或2.0以上框架支持。 一、火车采集器V2010SP3版,可供下载地址: https://www.wendangku.net/doc/c517553598.html,/Down/LocoySpider/LocoySpider2010SP3.html 二、net framework2.0,可供下载地址: https://www.wendangku.net/doc/c517553598.html,/download/https://www.wendangku.net/doc/c517553598.html,-Fra mework-2.0-For-Win98SE-ME-2000-XP/ 火车采集器和net framework2.0安装好后,可进行如下操作,操作步骤为:一、 1.在一堆文件中,找到如下图标(画有红方框、状似火车头的),并双击打开。 2.打开后可以看到如下界面,看着很复杂,但对于新手而言很多东西是暂时用不到的。在界面空白处(如下图红框区域内)右击,选择箭头所指“新建站点”。输入站点名,例如:“西装”,保存即可。 3.在新建站点“西装”(红框区域)处选中再右击,选择从该站点新建任务。

二、 第一步:采集网址规则 1.先要找到自动更新的内容来源:如经常更新关注度较高的博客、专业网站等,这里我们就拿淘宝论坛https://www.wendangku.net/doc/c517553598.html,举个例子。找到开始采集地址栏右侧,点击向导添加。 2.添加开始采集地址中的多页类似地址形式前,要分析一下它的类似形式,例:我们在淘宝论坛中搜索“西服”相关内容,然后任意翻阅不同的页数查看它的网页地址。 第一页地址、第二页地址、第三页地址分别为: 以此类推,分析出其不同点在于上图红框处的数字变化,因此:假如我们只采集论坛的第一页,就在多页类似地址形式栏粘贴第一页的网址,按一下(*)将选中的数字1替换成(*), 再将数字变化改为相应页数:1, 然后点击添加、完成。

织梦建站最全教程

织梦建站最全教程:安装篇 今天将要向大家介绍的是如何快速安装织梦CMS及后台管理功能简介。 一、环境配置 织梦CMS是一款在PHP和MYSQL环境下运行的程序,无论是在网络空间上还是在本机上运行 织梦CMS都需要这个环境的支持,所以学习织梦建站之前我必须先完成环境的配置。如果你要 在网络空间里安装织梦程序,请咨询空间,是否支持。我这里主要介绍下如何快速搭建本地环境。完成本地环境的搭建,我们需要下载APMSERV这个软件。(点此下载APMServ5.26) 1、下载完成后,我们可以看到APMServ5.26是一个7zip自解压文件,是一个绿色安装包,我们 将其解压到我们的硬盘里就可以使用了,这里我们要注意一点:由于APMServ5.26程序不能识 别非英文字符的路径,所以请我们解压时注意选择英文路径,例如:E:\APMServ5.26)。解压 完成后我们打开程序目录找到APMServ.exe双击运行。打开界面如下:

2、点击“启动APMServ”,注意状态栏一定提示Apache、mysql启动成功才表示启动成功。 (提示:如果无法启动,可能是被迅雷、PPLIVE等软件占用了80端口,你可以关闭80端口 或将Aphache端口改为其它的,比如:8080。) 3、点击右上角的访问本地网站或运行http://127.0.0.1,运行http://127.0.0.1/phpinfo.php可 查看php组件运行情况。到这里为止我们的Aphache+php+Mysql运行情况就架设好了。二、安装织梦CMS程序 当我们完成本地环境配置后,我们就可以安装织梦CMS程序了。请大家下载一个织梦CMS 程 序,官方最新版本为V5.5。(点此下载织梦V5.5) 1、下载完成后,请大家将程序解压出来,你发现有一个uploads文件夹,请大家打开这个文 件夹,然后把所有的文件复制到APMServ5.26程序目录下的htdocs文件夹下。(例如E:\APMServ5.2.6\www\htdocs) 2、请大家现运行http://127.0.0.1看看,应该会出现织梦CMS的安装界面了。

最新织梦dedecms采集图文教程(超详细)

?看到很多网友都为织梦(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会 首先我们打开织梦后台点击采集——采集节点管理——增加新节点 这里我们以采集普通文章为例,我们选择普通文章,然后确定 我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。 然后打开你想要采集的文章列表页,这里我们以织梦官网为例 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/打开这个页面,右键——查看源文件 找到目标页面编码,就在charset后面 页面基本信息其他的一般就不用管了,填完了如图

现在我们来填写列表网址获取规则 看看文章列表第一页的地址 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_1.html 对比第二页的地址 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_2.html 我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_(*).html 就是把1换成了(*)因为这里只有2页,所以我们就填从1到2每页递增当然是1了,2-1...是等于1吧 这里我们就填写完了(https://www.wendangku.net/doc/c517553598.html,) 可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图 每行写一个页面地址 列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页 右键查看源文件找到区域开始的HTML,就是找文章列表开始的标志。

织梦cms自定义模型使用教程

自定义模型使用教程:

在织梦系统中有内容模型这个概念,不同内容模型可以用来构建不同内容形式的站点,在系统中自带了以下几种模型:普通文章、图集、软件、商品、分类信息、专题。通过系统自带的模型,我们可以用来构建不同类型的站点,例如:使用图集可以做一个图片站,用软件模型构建一个软件下载站点。 当然以上随系统附带的模型被称为系统模型,用户可以自己定义一些模型,比如图书、音乐专辑等,自定义了这些模型才可以构建更多内容形式的站点,本篇将讲述如何使用系统的自定义模型管理功能来实现内容模型的构建。 我们首先登录系统后台,点击[核心]-[内容模型管理],进入内容模型管理界面,如下图所示: 这里我们介绍几个相关参数的概念: ?ID号用于区分模型的唯一ID,一般常规模型的ID都是大于0的,比如普通文章、软件等,如果使用了单表模型,ID一般需要小于-1,例如这里的分类信息模型; ?频道名称用于识别频道类型的标识; ?识别id系统用于识别的id,这个关系到模板方面; ?附加表系统内容附加表项; ?模型类型分为系统类型和自动类型,系统类型为固化在系统中的内容模型,自动类型为用户可创建的内容模型类型; 接下来我们开始介绍如何使用自定义模型管理来创建一个自己的模型,并且用于建设不同内容类型的网站中去。 这里我们介绍一些周边的内容,几个要用到的概念: ?字段在数据库中,表的列称为字段,织梦系统也是如此,但更恰当的说法,存储某个内容信息单元,称为字段,例如标题、来源、作者等都是一个字段; ?内容系统主表程序将一些公用字段存储在系统主表dede_archives,例如:标题、关键词、缩略图等,主表具体字段可以查询织梦帮助中心(https://www.wendangku.net/doc/c517553598.html,)的有关二次开发手册数据表部分的内容; ?附加表不同内容模型对应不同的附加表,通常以dede_addon[识别ID]命名,附加表中存放的都是详细内容的相关字段(非公用),例如:文章内容(dede_addonarticle)、软件类型(dede_addonsoft)、图片集合(dede_addonimage)等; ?单表独立模型存储时候不用到“主表+附加表”的结构形式,直接使用单个数据表进行存储内容数据,这样脱离主从表,减少主表数据服在开销,可以从很大程度上解决数据负载问题; 明白了以上几个概念我们可以来学习如何来自己创建一个内容模型了。 一个完整的内容模型包含模型数据表、数据字段、模型模板、模型参数4个部分,制作一个内容模型大致有以下几个步骤:1.模型规划;2.模型制作;3.模板制作;4.栏目设置,下面我们从上面4个步骤来讲解内容模型的制作。这里我们以一个图书模型(book)为例子,这个模型主要功能就是介绍书籍。

DEDECMS织梦制作手册超详细

DEDECM模板制作教程 1.Arclist 标记的应用,使用率很高,相当实用,所以我们使用都必须熟练掌握。 2.Field标记在封面模板、列表模板、文档模板的使用频率很高,实用。主要用来获得到系统变量的值或者路径,用法很灵活。可以直接展示数据,如调用position ,得到栏目一> 栏目二”这样形式的链接;或者,调用templeturl 得到/templets 这样路径。 3. Channel标记主要用于获取栏目列表,用法非常简单,主要是区分“ type = top,sun/son,self "的所调用的对象就行了。 4.Type标记表示指定的单个栏目的链接,用法非常简单。 5.Autochannel标记使用实例 6.Mytag标记使用实例板中多次出现的相同元素用一个自定义标记表示出来,从而达到,一次更改,全局更换的效果。辅助插件的广告管理也有相似的效果。 7.Type标记用于获取一组投票表单。其使用范围限于:封面模板。 8.Flink 标记使用实例用于获取友情链接。调用该标记后可以得到四种友情链接的形式。 9.Mynew标记使用实例用于获取站内新闻。站内新闻有利于站长及时与会员沟通。 10.ChannelArtlist 标记使用实例用于获取当前频道的下级栏目的内容列表。该标记在封面模板(包括主页)中的经常被用到 11.List 标记使用实例 12.Pagelist 标记使用实例 13.Pagebreak标记使用实例 14.Prennext标记使用实例 15.Pagetitle 标记使用实例 模板教程【Arclist 标记使用实例】(一) Arclist 标记的使用思路、步骤: 一、明确使用范围 我们在使用任何标记的过程中,都必须明确其使用的范围,否则可能无法正常调用该标签, 围是: [Arclist 标记】的使用范圭寸面模板、列表模板、文档模板。 即对应文件夹下的 index_ 识别ID.htm 模板、list_ 识别ID.htm 模板、article_ 识别ID.htm 模板) 二、通过调试了解其使用方法 我调试的方法是: 将文件夹下的index.html文件代码,全部掏空。放入调用【Arclist 标记】的代码,再在IE中访 问网站主页index.php,就可以得到返回的数据。 注意:其它文件保持不变,我不懂PHP只能用这种方式调试,相信朋友们很容易上手的。 我调试【Arclist 标记】的具体代码如下: {dede:arclist typeid=" row='1' titlelen='2O' infolen=" imgwidth='100' imgheight='8O'} 文章ID:[field:ID/]
文章标题:[field:title/]
文章短标题:[field:shorttitle/]
文章标题的文字链接:[field:textlink/]
文章作者:[field:writer/]
vfont eolor="red"> 文章发表日期:v/font>[field:stime/] vbr /> vfont eolor="red"> 文章所属栏目的目录:v/font>[field:typedir/] vbr /> vfont eolor="red"> 文章所属栏目的名称:v/font>[field:typename/] vbr />

dedecms教程从入门到精通

dedecms教程从入门到精通 字号:大中小 2008-06-26 07:41 今天和站友们一起了解dedecms,讲三部分内容: 1、了解dedecms 2、安装及使用dedecms 3、对dedecms进行二次开发 说明:除了介绍部分,其余都是自己原创 第一节了解DedeCMS 1、什么是DedeCMS DedeCMS是一个网站应用系统构建平台,也是一个强大的网站内容管理系统。既可以用来构建复杂体系的企业信息门户或电子商务网站平台,也可以用来管理简单内容发布网站,不管是商务资源门户还是娱乐信息门户,它都是您管理网站的好帮手,能帮助您最大限度的去自由发挥您的网站设计天才,更轻松的驾驭管理您的网站而不需要非常专业的网站技术,使您把网站设计变成更加乐趣的工作,让您满足想到就会做到的梦想。借助灵活而强大的处理技术和先进的网站管理思想所构建出的软件,使您天才的设计思想在网站创意及管理等多方面尽情的去自由发挥而不受束缚。 这是DedeCMS官网上的说明,让大家先有个了解,DedeCMS目前版本为4.0,2007版一直在跳票。DeDeCMS的作者为:林学(IT柏拉图) 关于林学,可以通过这篇文章了解一下《专访“IT柏拉图”:让全世界都看到中国开源CMS!》,地址: DedeCMS应该是比较早走开源路线的CMS,因此有相当多的用户在使用。 2、系统需求 DedeCMS基于php语言开发,需要以下环境支持: 服务器平台inux、FreeBSD、Solaris、Unix、Win2000、Win2003 Web服务器运行环境: Apache1.3.XX(2.0.XX) / IIS5(6) + php4.3.X/4.4X/5.x + MySQL3.2X/4.0x+

织梦采集教程

织梦采集教程:织梦CMS普通文章采集-织梦CMS 以织梦官方站为例,我们采集站长学院下的PHP教程栏目,打开列表地址https://www.wendangku.net/doc/c517553598.html,/web-art/PH P_jiaocheng。 登录后台,进入“采集节点管理”,新建一个节点,选择内容模型为“普通文章”。 1.设置节点基本信息 先填写一个方便记忆的节点名称,选择目标页面编码为GB2312,防盗链模式不做设置,因目标站没做限制,这一项就不做修改,系统默认超时时间10秒。 2.设置列表网址获取规则 这一步我们要做些设置,获取文章列表地址,回到目标站列表页,观察分页间的变化,可以发现只有“14_”后的数字有规律的递增变化。 首页:https://www.wendangku.net/doc/c517553598.html,/web-art/PHP_jiaocheng/list_14_1.html 中间:https://www.wendangku.net/doc/c517553598.html,/web-art/PHP_jiaocheng/list_14_(*).html 末页:https://www.wendangku.net/doc/c517553598.html,/web-art/PHP_jiaocheng/list_14_172.html 复制一个分页地址,回到“新增采集节点”页面,选择“来源属性”为“批量生成列表网址”,把粘贴地址到“匹配网址”中,修改规律变化处为(*),“批量生成地址设置”处(*)输入1到172,这里的意思是生成出列表第一页到最后172页的所有地址。 测试一下,在弹出框中我们可以看到循环出172条地址记录,很顺利的就设置好了。有时候会碰到较难获取的列表,那我们可以把把没规律的地址复制到”手工指定列表网址“文本框中来采集。 3.设置文章网址匹配规则 上面指定好了文章地址来源页,这一步就需要在这些页面中找出符合要求的文章地址页了。打开一个列表页面观察,左栏的方框中包含了我们需要的全部地址,这种情况区分明显的页面,可以利“区域开始的HTML”和“区域结束的HTMLL”设置进行过滤。 不过也可以使用其他方法。把鼠标移到各处链接地址,观察浏览器左下角显示的完整地址,我们需要的地址都包含“PHP_jiaocheng/20”,那我们把它填写到“必须包含”中。 两种方法都能够过滤出地址,碰上复杂页面,可以配合起来使用,加上正则,几乎没有筛选不出的地址,附(图5.1)对照。最后确定,进入下一步“网页内容获取规则”。

解决dedecms不能自动采集问题

北京服务器托管https://www.wendangku.net/doc/c517553598.html, 织梦DEDECMS安装发现fsockopen 函数被禁用,解决自带采集问题。 织梦DedeCms安装时发现fsockopen 函数被禁用的解决办法: 现在使用织梦DedeCms网站的站长越来越多,黑客也开始活动起来。争对DEDECMS的开源特性,很多能利 用的漏洞,都被黑客利用从而进行攻击等。做为站长或服务器idc商,肯定是想办法解决这些隐患的!所 以很多idc空间商,都把虚拟主机用户的php.ini中的fsockopen函数给禁用了!导致dedecms无法采集。 前几天给一个客户安装程序的时候就碰到此问题。让客户和空间商沟通无果。本站搜搜源码结合多年的php 开发经验,找不到了解决办法。如下: 第一:原理我们是把fsockopen函数替换成pfsockopen 函数,因为pfsockopen可保持keep-alive连接, 使黑客无法持续性的攻击。 第二:涉及到的dedecms文件有如下: dedecms5.6有如下: include/dedehttpdown.class.php include/dedecollection.func.php: include/mail.class.php dede/module_main.php dede/api_ucenter.php dedecms5.7有如下: include/dedehttpdown.class.php include/sphinxclient.class.php include/dedecollection.func.php: include/mail.class.php ask/data/scores.inc.php: dede/module_main.php dede/api_ucenter.php plus/bshare.php 找到这些文件把其中的fsockopen替换成pfsockopen就可以了。 有的人会说这么多文件一个一个的寻找。太累了。呵呵。别着急。本站提供相当方便快速替换方法。 大家下载editplus工具使用在文件夹中查找替换就可以了。 安装好editplus软件,选择编辑——在文件中替换——选择好DedeCms目录,指定fsockopen替换成pfsockopen就可以了。 有需要的朋友可以去试试吧!不过现在站长要想把网站做好还是要原创。 北京服务器托管https://www.wendangku.net/doc/c517553598.html,

织梦cms采集图文教程

看到很多网友都为织梦(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会 首先我们打开织梦后台点击采集——采集节点管理——增加新节点 这里我们以采集普通文章为例,我们选择普通文章,然后确定 我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。 然后打开你想要采集的文章列表页,这里我们以织梦官网为例 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/打开这个页面,右键——查看源文件 找到目标页面编码,就在charset后面 页面基本信息其他的一般就不用管了,填完了如图

现在我们来填写列表网址获取规则 看看文章列表第一页的地址 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_1.html 对比第二页的地址 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_2.html 我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写 https://www.wendangku.net/doc/c517553598.html,/web-manage/jianzhanxinde/list_49_(*).html 就是把1换成了(*) 因为这里只有2页,所以我们就填从1到2 每页递增当然是1了,2-1...是等于1吧 这里我们就填写完了(https://www.wendangku.net/doc/c517553598.html,) 可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图 每行写一个页面地址 列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页 右键查看源文件找到区域开始的HTML,就是找文章列表开始的标志。

相关文档
相关文档 最新文档