文档库 最新最全的文档下载
当前位置:文档库 › 04金西分区文本1119171316313

04金西分区文本1119171316313

04金西分区文本1119171316313
04金西分区文本1119171316313

第一章总则

第1条依据《中华人民共和国城乡规划法》,为了全面建设小康社会,实现统筹城乡发展、统筹区域发展、统筹经济社会发展、统筹人与自然和谐发展、统筹国内发展和对外开放等发展战略的需要,更好地指导金西经济开发区各项建设活动,促进金西经济开发区社会和经济的健康发展,编制本规划。

第2条本规划是金华市城市总体规划金西经济开发区分区城市建设和发展的指导性文件,凡在规划区范围内进行的各项土地及空间利用规划的建设活动,均应遵照《中华人民共和国城乡规划法》的规定,执行本规划。

第3条规划依据

3—1《中华人民共和国城乡规划法》;

3—2 《中华人民共和国土地管理法》;

3—3《中华人民共和国环境保护法》;

3—4 《城市规划编制办法》;

3—5《城市用地分类与规划建设用地标准(GBJ137-90)》等相关技术标准;

3—6《建设部城市规划强制性内容暂行规定》(2002);

3—7《浙江省国民经济和社会发展第十一个五年规划纲要》;

3—8《金华市国民经济和社会发展第十一个五年规划纲要》;

3—9《金华市城市总体规划(修改)2006~2020》;

3—10国家、省、市相关的其他政策和法律文件。

第4条本规划期限:近期 2009-2015年,远期 2016-2020年。

第5条本次规划的规划区涵盖金西三个镇(汤溪、罗埠、洋埠镇)行政区170.81平方公里面积,其中分区规划城市建设用地19.96平方公里。

第6条文中加“下划线”条文为本次规划的强制性内容。强制性内容是对城市规划实施进行监督检查的基本依据,违反强制性内容进行建设的,属严重影响城市规划行为,应依法进行查处。

第二章城乡一体化规划

第7条区域协调发展战略

金西经济开发区分区的发展一方面应该与周边区域的城镇、产业园、产业带形成优势互补、错位发展,并在基础设施建设等方面相协调;另一方面也要积极的内引外联,形成分区发展的核心吸引力和竞争力。其中,区域协调包括三个层面:首先,根据自身优势条件,要在总体定位上与金华市内及周边同级别的城镇、开发区和产业园区保持一定的错位和协调,形成分区经济特色;其次,要积极与以蒋堂镇为主的金西经济产业带形成战略协作关系,使之成为金西与中心城区联系的纽带;再次,要注重以镇区为依托的产业园区与周边村镇的发展关系,通过产业纽带将城乡联系在一起,真正实现城乡一体化发展。

第8条城乡空间布局规划

8—1 总体空间结构

“水脉绿网生态底、一轴三核四片区”。具体为:

“水脉”——以衢江、厚大溪、莘畈溪为主干,以纵横交错的支流、冲沟和灌渠为分支,以西畈、峙垄等大型水库和散布各处的小型坑塘为节点,形成健康、完整的水文体系。

“绿网”——以南部的九峰山及山前植被覆盖较好的丘陵地区,以及水系、冲沟沿线的缓冲植被带等构成的区域生态绿地网络,用以维护水系统的健康、提供生物保护、休闲游息以及乡土文化体验等多重功能,另一方面也支撑起金西经济的生态安全。

“生态底”——水脉绿网之间分布的广阔农田,构成金西经济区域发展的绿色基底。

“一轴”——即以厚大溪、白汤下街和经发街为依托,联系南北片区、带动中间地带的发展轴,实为四轴合一,分别为生态游憩轴、经济商贸轴、文化休闲轴、城市生活轴。

“三核”——汤溪、罗埠、洋埠三镇是开发区发展的基础,也是地区人口、文化、管理、公共服务的核心。其中汤溪镇作为整个开发区的核心,城市功能更为完备,除了服务南部片区外,对其他两镇和北部工业区具有一定的辐射作用。而罗埠、

中,罗洋工业片区以罗埠、洋埠镇为依托,在衢江与杭金衢高速间形成的工业园区;虹戴农业观光片区是以中部基本农业区为依托,沿虹戴公路及白汤下街、经发街而形成的以都市农业、观光农业、休闲农业等为主的功能片区;汤溪综合功能片区则是以汤溪古镇及开发区管委会为依托,形成的集工业、居住、行政办公、文化教育、商业休闲等功能于一体的综合功能区;而位于九峰山麓的生态农业旅游片区则包括了九峰山景区,西畈、九峰等大型水库,上镜、寺平、中戴等古村落,以及茶、桔、桑、杨梅特色种植等众多旅游资源,以农业观光及文化休闲旅游功能为主。依托各自的资源条件和区位优势,形成各有特色又功能互补的城市组团。

8—2 村镇体系规划

本次规划依据《金华市城市总体规划(修改)2006-2020》中关于村镇体系的规划,将金西经济开发区的城乡居民点等级及职能分为三类,其发展规模和职能引导如下表所示。

表1 村镇体系规划表

第9条中心村设置建议

9—1在分区规划建设用地范围内不设置中心村。

9—2在分区发展预留用地范围内的村庄,原则上不建议设置成中心村。

9—3 与分区现状建成区或规划建设用地基本连片的村庄,不建议设置成中心村,包括洋埠镇的下潘村,不设为中心村。第10条行政村(基层村)、农居点整合要求:

10—1同一行政村所辖的各个自然村原则上迁并至一处;

10—2城镇周边农村居民点应积极迁移至城镇,逐步实行“撤村建居”;

10—3 距中心村1公里之内的农村居民点应尽量并入中心村;

10—4 以规模较大的自然村为基础,缩并零星分散且规模较小的农居点。山区村庄应结合“下山脱贫”政策,近期内实施迁村计划,尽量向集镇、城镇集聚。

10—5经济条件差,没有发展潜力的村庄往附近经济条件好、发展潜力大的村庄靠拢。

10—6农村居民点应尽量靠近交通线发展,保证其对外交通的便利。

10—7 整合土地资源,节约用地,改善农民居住环境,保护农村生态环境。

10—8 保护好当地的地域文化和自然风貌。

第11条空间分区管制

11-1 已建区(“红线”)

为金西经济开发区和三个城镇的现状建成区,规划保留的行政村现状建设用地。控制要点:11-1-1鼓励进行原地改造的建设项目,建设项目须符合规划要求;

11-1-2 不断完善基础设施和社会设施,适度提高土地利用率,尤其应提高产业园区、农村居民点的土地集约利用率。

11-1-3 鼓励本区内有助于改善生态环境的开发和改造活动。

11-1-4区内划定的历史文化建筑应坚持保护与利用相结合,保护原有的风貌和环境,严禁随意拆建,执行“紫线”控制

11-2 适建区(“红线”)

为现状建设用地之外、规划远期城乡建设用地内的区域,控制要点如下:

11-2-1金西区域内的一切建设用地和建设活动必须遵循和服从依法编制的城乡规划,各项建设应依法办理建设用地选址意见书、建设项目用地规划许可证、建设工程规划许可证、乡村建设规划许可证,不得乱占乱建。

11-2-2开发区、各镇建设用地增长边界为远期建设用地范围,除重大基础设施外,城市建设项目不得超出相应边界进行建设。

11-2-3基础设施建设应强调集中紧凑。

11-2-4社会设施按公共中心的服务范围、人口、等级水平,适应各区域的开发时序要求适时开发建设。

11-2-5“绿线”控制要求:按照各级城乡规划划定城乡居民点内的公园绿地、小游园、防护绿地等生态用地的范围;绿线内所有树木、绿地、绿化设施等,任何单位和个人不得随意移植、砍伐、侵占和损坏,不得改变其绿化用地的性质。各类改扩建、新建项目,不得随意越过绿线控制范围。

11-3 限建区

11-3-1 建设用地预留区控制要点:

在远期建设用地开发完毕并调整相应规划之前,应严格控制基础设施、社会设施投放量,禁止房地产项目和产业园区开发项目,以控制为主。

区内不设中心村。现有村庄应控制规模。尤其是作为产业园区备用地内应少设保留基层村,鼓励外迁。

11-3-2 生态绿地控制区控制要点:

本区域是专门划定的省级风景区九峰山风景区。

本区域以生态自然保护为主导,可按风景区规划、生态旅游区规划,展开与功能适应的适度的建设活动,严格控制建设量与开发强度,防止对景观资源、自然资源的破坏。游人集中的游览区或核心景区内,不得建设宾馆、招待所及休养、疗养机构;珍贵景物周围和重要景点上,只许可建设必须的保护和附属设施。

严格限制其它用途,现存零星建设用地不得扩建规模,有条件时实施搬迁。

区内不设中心村,现有村庄应控制规模或引导搬迁,尤其是核心景区内的村庄应在规划期内逐步搬迁。保留的基层村以农家乐、旅游服务为重要功能,并加强对村庄面貌的整治。

11-3-3 历史街区和重要历史地段(“紫线”)控制要点:应充分挖掘和保存传统文化和历史遗产,注重历史文化的延续性,处理好旅游开发和保护的关系。本区域主要保护好省级文保单位——汤溪城隍庙。历史建筑保护的具体范围在下一层次控制性详细规划中确定。

11-3-4 基础设施廊道(“黄线”)控制要点:

电力、电信、燃气等基础设施用地要求严格控制,保障用地面积要求。

综合廊道主要有:高速公路,铁路,金西大道、虹戴公路、白汤下路。

综合廊道宽度一般按交通通道两侧各控制50米加以控制(城乡居民点内控制50米有困难时,可压缩至20米);预留和保证交通枢纽用地(车站、立交等)。

铁路廊道控制总宽100米。

杭金衢高速公路金西开发区段两侧按50米控制。杭长线金西开发区段北侧按50米控制,南侧按60米控制(预留浙赣铁路改线通道)。金西大道两侧控制20米、虹戴公路两侧控制50米、白汤下路两侧控制20米。在控制范围内禁止与基础设施建设无关的其他一切建设活动。

高压线不能随意走向在城区内斜穿,应与综合廊道、各类道路的走向相一致。控制好现有高压廊道,一般与城市建设矛盾不大的现状高压廊道予以保留,并按相应的技术规范要求控制宽度和建设要求控制;与城市建设矛盾较大的,应予以调整,改走综合廊道。控制预留的高压通道禁止其它建设活动。

单侧高压走廊控制宽度按下表《高压走廊控制宽度(GB/50293-1999)》控制,多条高压走廊控制宽度可按《浙江省城市电网规划技术原则》指标进行计算,采用《多条高压走廊控制宽度》表。

表3 多条高压走廊控制宽度

公路两侧建筑控制区(高速公路除外):具体范围:省道不少于15米、县道不少于10米、乡道不少于5米;公路弯道内侧及平交道口附近的建筑控制区还须依照国家规定满足行车视距或者改作立体交叉的需要。

11-3-5 一般农用地保护区控制要点

在本区域内不得建设除农业附属设施以外的任何其他建(构)筑物。

本区域用地类型的变更必须符合相关法律、法规规定的审批程序。

11-3-6 水源涵养区和自然山体为主体的生态空间

保护自然生态系统,维护生态多样性,严禁滥砍滥伐和破坏山林等行为。

本区域严格控制建设活动,引导和鼓励人口外迁至各城镇和平原地区。

11-4 禁建区

主要分水体保护控制区、饮用水源保护区、基本农田保护区、次重点地质灾害防治区四类。

11-4-1 饮用水源保护区:根据《饮用水水源保护区划分技术规范》确定饮用水源保护区范围。本次规划原则确定如下:——九峰水库、莘畈水库:一级保护区为取水口半径300米范围内的水域,陆域范围为取水口侧正常水位线以上200米范围的陆域(不超过流域分水岭范围);水库一级保护区边界外的水域设为二级保护区,陆域为水库周边山脊线以内(一级保护区以外)及入库河流上溯3000米的汇水区域。

控制水污染源,开展生态清淤和冲淤工程。严禁排入工业废水和生活污水,其沿岸防护范围内不得堆放废渣,不得设立有害化学物品仓库、堆站或装卸垃圾、粪便和有毒物品的码头,沿岸农田不得灌溉工业废水、生活污水及使用持久性或剧毒农药。保护区内禁止开发建设行为,只容许进行山林维护、保育活动。

水源保护区内的现有村庄应逐步搬迁至区外的城镇和平原地区中心村。

11-4-2 水体保护控制区(蓝线)控制要点:

严格保护现有水域,不得减少水域面积。原则上不得改变其原有的水域形态,并尽量保留生态自然岸线。

在水体陆域保护范围内原则上不得建设除防洪排涝或水利设施以外的任何其他建(构)筑物,滨水地区现状建设对水域造成污染的必须迁出或逐步改造。一般水库的陆域按水库周边100米范围作为陆域保护范围;作为饮用水源的水库的陆域保护范围划定及其它控制要求见“饮用水源保护区”的规定和相关要求。

11-4-3 基本农田保护区控制要点:

新一轮土地利用总体规划中基本农田的划定应在已建区、适建区外,并尽量避让限建区中的预留区以及城区有明确休闲功能和其它功能安排的用地;在基本农田保护指标能落实的情况下,宜安排在明确控制的基础设施综合廊道外。

严格保护该区域内基本农田和优质园地,不得改变其原有用地形态,不得减少用地面积。

在本区域内不得建设除农业附属设施以外的任何其他建(构)筑物。

涉及到重大基础设施或其它重大规划思路变更而必需使用本区域用地类型的变更必须符合相关法律、审批程序。

11-4-4 次重点地质灾害防治区(黑线):本区域以生态自然保护、水源涵养、山林养护为主导,核心是保护自然生态系统,维护生态多样性,加强地质灾害防治,严禁滥砍伐和破坏山林等行为以及影响地质灾害防治的其它行为。

本区域严格控制建设活动。人口总量严格控制,引导和鼓励人口外迁至各级城镇和平原地区。

第12条分区建设引导

结合金西经济开发区空间分区管制要求,加强对村庄建设的整体引导。

12-1 已建区

开发区及各城镇现状建成区范围内的村庄:根据开发区或城镇总体规划要求、村庄建设能力等,逐步、逐批进行改造。鼓励实施整体改造。对一些经济实力较弱、改造实在有难度的村庄,近期进行环境整治,重点改造危房、完善基础设施和公共服务设施,争取在中远期内完成改造。

制为主,近期可实施环境整治,有条件的村庄鼓励优先改造。规划城镇公园与绿地等开敞空间范围内的村庄,应逐步搬迁,集中安置。

12-3 限建区

12-3-1 建设用地预留区:根据规划指导村庄布局调整和改造建设;对于与规划功能不符或位于工业区范围内的村庄,禁止在原址随意扩建;严格控制村庄建设规模,提倡公寓式安置。

12-3-2生态廊道:严格控制村庄规模,禁止村庄随意扩建,原则上“只减不增”;新增村民住宅尽量引导至生态廊道之外集中建设。

12-3-3基础设施综合廊道:该范围内严禁设立新的村庄居民点,位于基础设施综合廊道范围内的现状村庄建筑应逐步迁出。

12-4 禁建区

水体保护控制区、饮用水源保护区中禁止村庄建设,在该范围内的现状村庄应逐步搬迁。

第13条城乡公共设施规划

规划目标:全面提高金西开发区区域城乡居民精神文化生活,构筑多元化、特色化、分层次、网络化的社会服务设施系统,促进城乡医疗卫生、教育、文体设施的一体化。

总体布局:金西开发区为市区西部的公共服务中心,服务本区及周边乡镇地区;其余中心村和基层村设置必须的教育、医疗、卫生、体育等设施,服务周边村庄和本村。

13-1 文化设施规划

13-1-1 金西区域内三个镇均设置一个文化活动中心。同时,金西经济开发区可参照省级“东海文化明珠”工程标准要求,设置文化活动中心;其余城镇按照市级“东海文化明珠”工程标准要求,设置文化站。

13-1-2各中心村设置一个文化活动俱乐部,每个俱乐部至少要有一个图书报刊阅览室、一个文化活动室、一个宣传橱窗(墙报)。基层村加强文化活动室的建设。

13-2 体育设施规划

13-2-1金西经济开发区(含汤溪中心镇)的体育设施配置标准应高于其他一般镇,建设游泳池、标准田径运动场等室外运动健身场所;其他城镇应设置适合居民健身需求的室外体育运动场,如标准田径场、篮球场、羽毛球场等和60平方米以上的室内体育活动室;鼓励中小学的体育设施对外共享。

13-2-2 农村地区:结合新农村建设,加强农村地区的体育健身设施与场地建设,积极贯彻《关于实施农民体育健身工程的意见》(体发〔2006〕13号)等有关文件精神,设置一定规模的室外体育活动场和室内体育活动室,若干条健身路径。各中心村应建篮球场、羽毛球场和室内乒乓球场,应结合公园绿地建设步行道、健身道和简易健身器械。

13-3 教育设施规划

根据《金华市中小学幼儿园布局专项规划(2005-2020)》,结合城乡空间布局调整,按照“高中阶段学校向中心城区集中、初中向两个开发区和重点镇集中、小学向乡镇和中心村集中、新增教育资源向城镇集中”的原则,进一步优化中小学空间布局,努力推进城乡基础教育均衡发展。

13-3-1高中和职业中学:加强高中教育,规划高中主要集中在金西经济开发区,规划保留汤溪镇的九峰职业学校,普通高中不少于24个班。

13-3-2初中:要相对集中,以各城镇布局为主。办学不少于18个班。

13-3-3 小学:开发区内根据相关规划要求进行小学布点,乡镇及农村地区,平原地区不足12个教学班级的学校和山区不足6个教学班级的小学进行撤并,就近并入交通比较便捷,人口相对集中的中心村和乡(镇)政府所在地的小学。

13-3-4 幼儿园:新区开发和旧城改造均应按国家《居住区规划设计规范》要求,合理配置幼儿园,并按标准化要求建设。新建和改扩建的幼儿园,应达到规范要求。要办好1所中心幼儿园,并要达到市级示范性标准。

13-3-5 成人教育与社区教育:成人职业教育主要集中在开发区布置,积极利用现有的成人和职业教育设施进行成人教育和职业培训。逐步形成以乡镇社区学校为主体,辐射所有社区和村庄的社区开放教育网络。

13-3-6 金西区域学校规划布局见学校布局规划一览表(表4)。

13-4 医疗卫生设施规划

根据《金华市区医疗卫生设施布局专项规划2006—2020》,建立金西经济区域医疗中心,完善社区卫生服务体系,实现“大病进医院、小病在社区、保健进家庭”的医疗服务新模式。

13-4-1 金西经济开发区:以医疗为主、公共卫生服务为辅,立足农村常见病的诊断和治疗,发挥其区域医疗中心作用,弥补城市医院辐射功能的不足,方便农民看病就医,同时负责牵头做好本责任区范围内的公共卫生工作。医疗设施的设置标准应高于其他乡镇。

13-4-2其他镇及农村地区:城镇和集镇型中心村设置社区卫生服务中心(站)(乡镇卫生院),以公共卫生服务为主,提供预防、保健和基本医疗等社区卫生服务,全面落实本乡镇的各项公共卫生任务。

一般中心村和有需要的基层村设置社区卫生服务点(农村卫生室、个体诊所),承担常见病和诊断明确的慢性病的治疗、预防、保健、康复、计划生育和健康教育工作。基层村(100户以上)设立社区卫生服务点(卫生室)或配备卫生联络员。每1000-2000服务人口配备1名社区卫生医生。

13-4-3 开发区内3个镇卫生院均设置疾病控制站、妇幼保健站、医疗急救站和卫生监督站,鼓励发展医疗康复和保健护理服务专业机构。

13-4-4 金西区域医疗卫生设施规划布局见表5。

注:近期保留婺城区第一人民医院,待金西综合医院建成后该院址保留为卫生院或改其它用地。

第14条区域综合交通规划

充分利用金西经济现有交通优势,整合水路、铁路、公路等多种交通形式,优化现有城市道路网,构建高效便捷的交通体系,提升城市整体运行效率。

14-1 铁路交通设施规划由专业部门制定,同时结合浙赣铁路及规划的杭长线预留规划用地,并应注重现有站场设施的改造和利用。

14-2 公路网规划

主干线网的布局规划以金西三个城镇规划和《金华市婺城区城乡一体化公路网规划》为依据,城市路网形成“五横三纵”的骨架;在此基础上调整制定分区、乡镇、村庄公路网规划。

14-2-1 主干线网布局

五横:杭金衢高速公路金西经济开发区段;46省道;虹戴公路;金西大道、汤南公路。

三纵:洋莘大道、白汤下公路、经发街。

14-2-2乡镇公路交通设施规划中心城镇以高等级公路与外界联系,相互间有快速通道相连;中心村处与等级公路结点上,与城镇联系可达性高;基层村(一般行政村)至少有一条进村公路,有条件的基层村之间应建立网格状乡村公路。通公交线路的中心村、基层村都应设立公交停靠站。

14-3 水运规划

根据《浙江省发展和改革委员会文件》浙发改交通[2006]474号文件和《金华市内河航运发展规划》,规划建设衢江航道、游埠枢纽,选址在洋埠镇正北方向,位于上宅村至洋埠村之间衢江南岸,并配套建设助航安全保障等设施;为此,规划将建设航运码头,规划拟选于衢江南岸、距离游埠枢纽以北500米,用地面积约10000平方米,岸线长100米左右。

第15条区域给水规划

15-1水源

除了金西水厂和汤溪水厂供水以外,远期和远景水源将增加九峰水库和西畈水库供水。

15-2 给水指标

规划期末农村生活用水标准为140L/人.d ;城镇单位建设用地综合用水量标准为0.28万m3/km2.d, 城镇单位人口综合用水量标准为0. 5万m3/万人.d。

15-3 用水量预测

金西开发区为5.9万m3/d,汤溪、罗埠、洋埠农村用水为1.1万 m3/d,规划城乡用水总量为7.0万m3/d。

15-4 水厂规划

规划建设汤溪水厂,以莘畈水库为水源,供水规模5.0万m3/d;保留金西水厂,供水规模为2.0万m3/d,二座水厂总供水规模7.0万m3/d。

上述两座水厂的供水区域和供水量分别为:金西经济开发区5.9万m3/d,汤溪镇、罗埠镇、洋埠镇三镇的农村共1.1万m3/d。

15-5 输水干管

规划汤溪水厂DN800~DN900输水干管16km,管道沿莘畈溪边敷设至东门上背高位水池。

第16条区域排水工程规划

16-1污水量:金西经济开发区规划期末污水量为5.0万m3/d。

16-2 污水处理厂

汤溪、罗埠、洋埠农村生活污水须经沼气净化池处理后排入水体或排水管道;城镇生活污水排入规划污水处理厂。

金西经济开发区规划建设5.0万m3/d规模的污水处理厂,地址设在罗埠镇西北,规划用地7.2公顷。

规划区域内工业污废水须经企业自行处理达到《污水综合排放标准》后才能接入管网。污水经污水处理厂处理达标后才能排入水体。

第17条区域电力规划

根据《金华市区电力设施布局专业规划(2007—2030)》和《婺城区2008—2012年农村电网滚动规划和“十二五”农网规划》,金西区域将随着开发区的发展建设,人口的增加和产业结构的变化,规划建设220千伏变电所,建设满足金西区域负荷需求的110千伏变电所,逐步淘汰35千伏变电所。详细情况见分区电力工程规划内容第十七章。

第18条区域电信规划

18-1规划原则

18-1-2规划电信网应分段实施,各阶段做到平滑过渡。

18-1-3规划的局、所应参照国内发达地区经验按大容量、少局所原则,大量采用远端模块,使光纤与城市规划布局同步,尽量靠近用户,对发展新型通信,在用地上给予支持。

18-2规划措施

根据区域发展需要,罗埠镇和洋埠镇不增加电信支局。规划通讯线路敷设在道路的西北侧,并采用管道电缆,结合城乡道路建设时一次性按规划敷设到位。

第19条金西区域广播电视通信规划

在充分发挥有线电视传输信息量大且稳定的优势、完成传递广播、电视节目的同时,利用系统网络开通计算机数据通信、图文信息等等商务信息活动。逐步改造现有广播电视线路走向,使之与规划道路一致,镇区新开发地区有线电视线路必须与规划的地下电信管路同管分孔敷线。

第20条区域邮政规划

在金西区域、尤其在各镇区主干道、商业繁华地段增加邮政网点,提高邮件寄递速度,满足城乡发展需要。

第21条区域环卫设施规划

金西区域的山下周村附近正建设一座垃圾中转站,建好后将为该区域使用,满足城乡发展需要。现有的填埋场拆除。垃圾从转运站直接清运至金华十八里填埋场进行填埋。分区内将建设垃圾转运站,具体布局见第二十一章中:环境卫生规划内容。

第22条新农村建设策略

22-1总体要求按照“生产发展、生活宽裕、乡风文明、村容整洁、管理民主”的社会主义新农村建设要求,加强村庄布局与城市化发展、产业布局、公用设施分布、生态建设等方面相结合。

22-2合理确定撤并村标准。根据地形条件、社会经济基础以及城乡发展战略,合理确定村庄的搬迁标准。分山地区、平原区确定搬迁村庄的人口规模,原则上平原区适量实施搬迁,山地区积极实施下山脱贫。

22-3新农村建设的主要内容包括:为农民提供最基本的基础设施,不断改善农民的生存条件;为农民提供最基本的公共服务,初步解决农民的后顾之忧;改善农业、农村生产条件,培育新的支撑产业,提高农民收入;深化农村体制、机制改革,为新农村建设提供制度保障。

22-4不断完善新农村建设的实施机制,包括:加快财政制度创新,为新农村建设提供物质基础;建立有效的农村融资渠道,为农村农业发展提供基本的要素支持;从体制上推动工业化、城镇化进程;转变政府职能,建立健全农民利益保护机制等等。

22-5规划中心村应优先实施改造,并通过用地指标倾斜等政策扶持,促进社会设施、基础设施的完善和农业人口的集聚。

第三章区域旅游资源利用规划

第23条发展目标

23—1经济目标

金西经济开发区的旅游经济发展目标为:充分发挥旅游业关联性强的带动作用,并使其不断整合,形成旅游业发展网络。同时,以旅游业带动一、二、三产业的经济收入增加,成为规划区内的龙头产业之一。

23—2 环境目标

金西经济开发区的环境发展目标为:通过旅游业的发展建设,完善规划区内的基础设施建设,并依托现有的资源环境,构建生态游憩网络,提升区域环境质量。将生态环境与旅游发展相结合,打造规划区内特色生态旅游产品。使环境建设成为旅游业发展的重要组成部分。

第24条发展定位

24—1 总体定位

规划金西区域的旅游产业总体定位为:将金西经济开发区建设成为金华旅游副中心、城市的重要支撑点之一,市民郊野度假休闲的旅游地,并充分与区域旅游发展相结合,使规划区成为“金义主轴线”上休闲度假的重要节点。

24—2 功能定位

规划区的旅游功能定位主要为以下几点:

田园风光游赏;

滨江度假休闲;

山地运动休闲。

第25条旅游功能布局

金西经济开发区的旅游空间布局为“两带七片区”。在功能片区内,布置类型多样的旅游活动,以片带面,最终形成金西旅游发展的整体环境。

25—1 “两带”

两条滨江河谷游憩带。该游憩带的活动依托境内贯穿的厚大溪、莘畈溪两条溪流及其岸边的河漫滩地带进行。在生态保护的前提下,有选择性地规划一段水域开展水上娱乐活动及岸线游览活动。

25—2 “七片区”

乡村生产观光片区——位于金西经济开发区东北部地区,以生产性观光功能为主,突出农村乡土文化。

滨江古迹观光片区——位于衢江岸边青阳洪、湖前等村落河谷一带。将水域休闲与古迹观光游览功能相结合,逐渐形成一个复合型的观光游览区。

农业风光游览片区——位于金西境内浙赣铁路、杭金衢高速公路的中间区域,中间有虹戴公路。规划建设农业观光园,即作为农业旅游基地,也起到开发区在道路两岸沿线的形象展示作用。

民俗文化体验片区——位于汤溪镇。以汤溪城隍庙为核心,民俗文化及节庆活动为发展环境,作为开发区内开展民俗文化展示、节庆活动集会的主要区域。

历史古村度假片区——位于寺平、中戴及鸽坞塔古村落。以突出各个村镇历史文化及传统民间习俗,且各个村落形成各自的游览主题,突出古村落的游览特色,作为游客观光度假的主要区域。

田园风光游赏片区——以上境古村落为核心,开展古村观光及郊野休闲类旅游活动。

山地宗教及运动休闲片区——位于金西经济开发区的南部,以九峰山风景区为核心。开展宗教朝圣、山地运动休闲的旅游活动,成为规划区内富有活力的旅游片区。

第26条九峰山风景区、古村保护规划

26—1 规划九峰山区域以生态自然保护、山林养护为主,核心是保护自然生态系统、维护生态多样性,严禁滥砍伐和破坏山林等的行为,严禁控制建设活动(同时参照空间管制内容执行)。

26—2古村保护结合旅游,规划对古建民巷,严格按规划控制、协调整治,充分利用好村落间的交通和景观资源,组织好游线,同时处理好村民生活和旅游接待的关系。

第27条旅游线路

为了提高金西经济开发区内各个景区及景点的可达性,依托规划路网及已有道路,根据《金西经济开发区发展战略规划》的旅游线路,满足游客游览活动的交通需求。

27—1 综合性旅游线路

规划金西经济开发区内的一条综合性旅游线路,以现有规划道路为基础,串联区域内主要的旅游资源点,并形成与规划区外的交通联系。

27—2 游线支线

由旅游综合性线路分流出的支路,通往主要道路的旅游功能区片,增加游客的可达性。

27—3 专项游线

两条水岸游线——在沿厚大、莘畈两条支流岸边布置游线。

27—4旅游村路

该线是连通各村庄的主要线路,也是游客步行、骑车游览的主要线路。因此,规划将现状乡间小路作为旅游村路,保证各文物古迹、遗址所在地之间的连通性及完善规划区内道路网络体系。

第四章分区发展规划

第28条分区发展目标

金西开发区分区的发展目标为:“建设经济发达,工业为主,旅游、服务相配套的现代化工业新城”。

具体为:金西将走生态田园式城市形态发展之路。依托东区、北区和启动区建设成工业产业集聚区;金西的南部依托九峰山水、生态古村落、衢江沿岸和万亩茶园等农业基地建设成生态旅游区;依托峙垄水库为核心联动汤溪老集镇建设成金

动,山水田城互为镶嵌,建设一座以工业为主,旅游、商贸相对发达,生态和谐、充满活力、宜居乐业的魅力新城,使之成为浙中城市群主轴线的西部桥头堡、中心城西部的副中心。

第29条分区职能能特征

29—1 分区城市性质:金华市区西部以工业为主,旅游、服务相配套,宜人居住的新城。

29—2 城市职能:强化和提升制造业生产基地;培育和完善宜人居住的环境。

第30条分区发展战略

从金西经济开发区现有产业基础以及周边市开发区、义乌及浙西、赣东区域的产业基础出发,依据产业基础、环保生态、产业前景和政府战略规划等标准制定开发区产业发展的整体战略:坚持按照“生态立区——工业兴区——农业稳区——旅游活区——商贸强区”的总体发展策略,打响金西经济开发区的生态牌、工业牌和旅游牌,在确保区域生态安全的前提下实施园区式开发布局,实现二一三产业联动。

第31条产业发展策略

31-1工业发展的战略重点

金西经济开发区分区的产业发展要以现有的产业为基础,结合金西经济开发区分区发展整体战略的要求,调动一切力量,加快工业化进程。

优先发展汽摩配、机械制造;依托纺织服装、五金汽配等龙头企业,引进培育产业链上下游企业,发展壮大产业集群。

31-2配套设施发展重点

依托已完成一期开发的九峰金城花园和金西商业街主体工程,加快建设金西宾馆,积极发展三产配套设施,完善公共设施和基础设施的建设,为分区发展服务。

第32条产业空间引导

金西经济开发区工业总体布局是:采取集中与分散相结合的形式、主要分布于经发街东侧和白汤下公路西侧黄土丘陵区块;罗埠、洋埠区块位于杭金衢高速公路北侧。

本次规划工业用地布局不按照工业门类划分,而是强调无污染工业(一类工业)布局。在这一前提下,考虑工业门类划分,培育产业集群。

第33条分区发展规模

33—1人口规模:近期2012年4万人口;远期2020年10.8万人。

33—2 建设用地规模:

近期2015年建设用地规模为12.11平方公里。

远期2020年建设用地规模控制在19.96平方公里。

第五章用地适建性评价

第34条根据《金华市城市总体规划(修改)2006—2020》的因子选择及评价,金西分区从生态保护的角度是最适宜进行集中开发的区域。

主要分布在汤溪镇区、罗埠镇区和洋埠镇区及其周边地区,但同时也是耕地保护较集中的区域。因此,具体的建设或保护区域需要结合城乡发展战略、空间布局,土地利用规划等最终来界定。

第六章土地使用与空间布局规划

第35条分区发展方向

金西经济开发区城市建设用地发展方向,主要向峙垄水库东部、北区和南区的空间发展。

即:南拓北展,绿野穿城。

第36条空间布局及功能结构

通过自然山水和人工廊道、区域交通通道、自身内部快速交通通道的分隔,形成“一轴三核四片区”空间布局和功能结构。

“一轴”——以峙垄水库为中心的开放空间和公共设施构成的城市中心轴。

“四片区”——即开发区的启动工业园、北区工业园、东区工业园、南区工业园。

第37条用地布局规划重点

37-1 确定合理的用地布局结构和功能配置,集约利用城市建设用地;

37-2 建立合理的功能布局,适当提高建设用地的开发强度,促进城市建设区的平衡有序发展。

37-3引导城市空间合理拓展,以满足规划期城市社会经济及文化活动的要求。其中,基础设施、生活服务设施及公园绿化等政府提供的城市综合配套设施用地必须优先保证。

37-4通过对旧村及部分工业区进行改造、更新等措施,实现城市土地开发由外延式向内涵式的转变,促进城市功能进一步更新与完善。

37-5居住用地与产业用地相配套,达到减少居民交通出行量、避免交通问题产生。

第38条居住用地建设原则

38-1 居住用地布局强调尊重自然,合理布局,居住区建设鼓励成片开发集中建设,形成规模。

38-2 综合考虑村庄实际,结合村庄改造,实现村庄为工业区配套的目标,解决“城中村”问题。

38-3强调基础设施改造以完善基础设施和服务配套设施为主,全面提高旧村的居住环境质量。

第39条居住用地空间布局

规划居住用地476.33公顷,可容纳人口10.80万人。

39-1 北区:规划居住用地159.58公顷,以洋埠集镇、罗埠的上章村旧村改造为主,罗埠集镇新区建设。

39-2 启动区:规划居住用地113.46公顷,峙垄水景公园以西区块。

39-3 东区:规划居住用地55.05公顷。在峙垄水景公园周围结合开畅绿地和水景,规划档次较高的居住小区。

39-4 南区:规划居住用地94.71公顷,形成相对独立的居住配套综合区。

39-5 汤溪老镇区:规划居住用地53.53公顷,以老镇改造为主,完善公共服务设施和市政基础设施。

第40条中小学规划

40-1 规划原则

40-1-1 本次规划将打破行政界限束缚,根据人口规模状况规划布局相应的中学。

40-1-2在尽量保留现有学校的原则下,重新调整中小学布局,优化教育资源。

40-1-3根据《金华市区中小学幼儿园布局专项规划》,依据各片区人口规模的具体状况,规划布局相应的小学,体现小学平均分布的原则。

40-1-4参照相应的规划标准,制定合理的服务规模。

第41条中小学服务规模

41-1小学:规划独立占地的普通小学以24—36班为标准,每班45人,每所学校的生源数为1080—1620人,占地面积2.5—3.2公顷。服务人口2—2.7万。根据现状学校能容纳的生源数和远景规划人口,规划布局小学5所,其中新增2所。

41-2 普通初中:规划独立占地的普通初中以36班为标准,每班50人,每所学校的生源数为1800人,占地面积5.0公顷左右,服务人口5—6万。规划布局普通初中3所,其中新增1所。

41-3 普通高中:在规划范围内现有一所汤溪高中,位于汤溪城镇内,有班级52班,《金华市区中小学幼儿园布局专项规划》中该高中规划办学规模为60个班,本规划中不再增加高中学校数量。

41-4 学校布局规划一览表:见第二章城乡一体化规划中表3 。

第42条旧村改造原则

42-1 以人为本原则:充分考虑村内原居民、非户籍居民等不同人群的实际需求来确定改造方案。

42-2 整体协调原则:在改造旧村的过程中,旧村自身应形成开放的系统,融入到分区的整体结构之中,加强与分区其他区域、系统的交流,从分区的整体出发,做到局部与整体、点与面的有机结合,使局部的发展改造融入分区的整体,分区整体的发展又带动局部。

42-3继承发展原则:在旧村的改造建设中,应保护与继承能反映其风貌特色、具有传统文化特点的建筑和空间环境。同时,在旧村的改造建设过程中,结合其传统特征进行统一和协调,形成具有地方文化特色的、整体和谐的现代城市空间环境。

42-4经济合理原则:改造方案应具有经济的可操作性,并不应侵害原有居民的合法经济利益。

42-5 社会安定原则:改造方案应避免引起社会矛盾激化。

第43条旧村改造措施:根据所处片区的规划,进行合理的定位,确定改造发展的用地性质及用地强度,使旧村的改造既满

43-2 按现行村庄改造政策,确定村庄改造用地规模,编制旧村改造用地红线图。

43-3 处于城市主要干道两侧的旧村用地,应以城市整体功能布局为优先考虑因素,结合各级商业服务设施的建设或商品房、写字楼的开发,进行统一改造。

43-4 一般地段的新、旧村居住用地,以逐步改善该居住组团的居住环境为目标,充分调动居民及由原村委演化而来的经济实体的积极性,通过公众参与,政府给予政策支持,进行综合环境整治。

43-5 老城镇中的旧村中保存有文物古迹,其改造与修缮应注重对这些历史财富的保护。

第44条住宅建设引导

44—1以集约用地和提高居住环境为目标,严格控制建成区以外、规划控制区内农村村民建房;

44—2 建立经济适用房和廉租房制度,适时启动;

44—3 商品房建设:提供适合不同层次居民需求的多样化选择,特别是针对外来常驻人口及新迁入人口,应将这些人口对住房的需求引导为对商品房的需求,科学合理制定居住用地供应计划。

第45条工业用地布局原则

45-1 工业布局强化从分散无序发展的状态向合理有序发展状态过渡,形成布局合理的技术先进的高效益工业产业群。

45-2 工业片区的建设强调集中的原则,考虑到金西经济济开发区分区的经济实力,和对工业用地的大规模需求,建议走集中发展的道路。

45-3新增工业用地选择要充分利用现有基础设施条件,集中整合发展;工业用地发展方向要考虑各个组团不同的环境禀赋与发展条件,以及金西开发区发展的整体利益,分期、分步骤逐步推进。

45-4 严格工业区的环保标准,布局不严格按照工业门类划分,而强调按照无污染的情况进行布局,这将有利于城市获得更大的综合效益。

第46条工业用地布局规划

金西分区集中规划了四处工业用地,规划工业总用地867.80公顷,占规划总用地的43.47%。其中:

46-1 启动区块:工业用地148.69公顷,一类工业为主,培育和集聚金西原有的企业实现产业的升级和结构的调整,带动开发区的全面开发,重点发展五金加工、机械制造、食品加工。

46-2 北区块:1)罗埠区块工业用地204.06公顷;2)洋埠区块工业用地47.52公顷;规划以一类工业用地为主,重点发展小商品制造、食品加工。

46-3 东区块:工业用地222.20公顷,规划严格控制为无污染的一类工业。

46-4 南区块:工业用地245.11公顷,规划为以一类工业用地为主。

第47条仓储用地规划

规划仓储用地为12.83公顷,占建设用地的0.64%,规划位于汤溪火车站北侧。

第48条公共设施布局规划

公共服务设施分级布置。公共服务设施分为:区级、片区级、居住区级。确定在启动区和靠近东区内设置区级公共中心,在其他片区形成各自的片区级公共服务设施中心。

公共设施总用地为196.74公顷,占分区建设用地的比例为9.86%。

48-1 区级中心

区级中心位于中心片区,由行政中心、商业贸易中心、文化娱乐中心、教育科研中心等组合而成,结合自然山水和现状条件,在中心片区形成多个功能中心。区级中心位于启动区,由商贸、行政中心等组合而成。

48-2 片区级中心

在各片区居住用地的地理中心,规划布置商业、文化娱乐、体育、医疗卫生等用地,形成各片区的公共设施中心。

48-3 居住区级中心

居住区级中心设在居住区内,根据《城市居住区规划设计规范》配置公共设施项目。

第49条综合交通用地布局规划

49-1 规划区对外交通用地包括长途客运站、高速公路等对外交通运输及其附属设施等用地。规划对外交通用地15.06公顷,占城市建设用地0.75%,人均用地1.39平方米。

第50条绿地规划

规划绿地145.95公顷,占城市建设用地7.31%,人均用地13.51平方米。其中公共绿地128.89公顷,占城市建设用地6.46%,人均用地11.93平方米。

规划结合自然水体、山体,建设区级公园2座。

第51条市政公用设施用地规划

规划市政公用设施用地24.48公顷,占城市建设用地的1.23%,人均2.27平方米/人。其中:供水用地0.63公顷,供电用地6.41公顷,供燃气用地0.38公顷,公共交通用地3.12公倾,货运站场用地2.38公顷,加油站用地0.73公顷,邮电设施用地1.68公顷,环卫设施用地2.60公顷,消防站用地7.33公顷。

第七章公共设施布局规划

第52条行政办公用地规划

区级行政中心以已建成的金西经济经济开发区管委会为依托,在金西经济大道北侧布置。即现有的金西经济开发区管委会用地和管委会以东用地,为行政办公用地;商业办公用地主要结合商业贸易中心设置。其他各片区中心设置各自的行政办公用地,用以安排未来为各片区服务的行政管理功能。各片区内商业办公功能结合商业金融功能混合使用。各居住区应设置居住区级管理中心。规划行政办公用地19.48公顷,占城市建设用地的0.97%,人均1.80平方米。

第53条商业服务设施用地规划

结合分区空间结构,形成以区级商业服务设施为中心,片区级商业服务设施为骨干,居住区级商业服务设施为有效补充的商业服务设施网络。规划布局的商业金融服务设施用地面积为77.39公顷,占城市建设用地的3.88%,人均7.16平方米。53-1 区级商业中心:沿白汤下公路至金西大道区块和南区规划道路两侧布局。在南区工业园布置区级商业中心。

53-2 片区级商业中心:片区级商业服务中心分别位于各片区地理中心或居住功能中心。

53-3农贸市场:本次规划农贸市场(菜市场)新建2处,分别位于启动区和南区,并将其提高组团级公共服务设施,服务半径在800—1200米。同时仍可利用三个城镇内的原有市场。

第54条文化娱乐、体育设施用地规划

文化娱乐设施、体育设施规划以分散布局为基本原则,以建立健全区级、片区两级文化娱乐体育设施为目标,在启动区和南区设置区级文化娱乐中心,远期在南区工业园白汤下公路北侧建设区级体育中心;在其他片区设置文化娱乐设施和体育设施用地,形成以区级文化娱乐体育中心为龙头、片区级文化娱乐体育中心为骨干,居住区文化娱乐体育设施为基础的文化娱乐体育设施服务网络。

规划集中文化娱乐用地38.17公顷,占城市建设总用地 1.91%,人均3.53平方米;体育用地16.47公顷,占城市建设总用地 0.82 %,人均1.52平方米。

第55条医疗卫生设施用地规划

完善各级医疗设施体系,形成配套合理的医院卫生设施格局;医院总规模按3床/千人标准计算,总床位不应少于330张。规划医疗卫生设施用地10.29公顷,占城市建设用地的0.51%,人均0.95平方米。

55-1 区级公共卫生服务中心新建金西医院,规划位于经发街以西、纵一路东侧地块,用地面积3.67公顷,床位400张。近期保留婺城区第一人民医院,远期搬迁至新建金西医院。

55-2 社区卫生服务中心规划四处,分别为:保留汤溪卫生院改造为社区卫生服务中心;南区规划布置一所医院,并设社区卫生服务中心,占地2.79公顷,罗埠镇卫生院改造为社区卫生服务中心,洋埠镇卫生院改造为社区卫生服务中心;此外,根据需要可设置若干社区卫生服务站。

55-3 各片区根据人口发展的需求,配套完善集防疫、妇幼保健以及慢性疾病、健康教育等项目为一体的社区卫生服务中心和社区卫生服务站等,形成多层次、全方位的医疗卫生网络结构。防疫站、妇幼保健院以及慢性病医院、健康教育所等结合医院用地布置。

第56条教育科研用地

为金西教育事业的发展,提高教育环境质量,吸引更多的人来开发创业,在南区生活区中心规划布局高等教育与科研用地27.25公顷,占城市建设用地的1.36%,人均2.52平方米;并于南区工业区中规划预留了科研与职工教育培训用地。

第57条其他公共设施用地

本分区内规划了二座福利院,其中现有在东区的(敬老)福利院保留,另规划一所位于南区块西侧,两座合计占地5.55公顷,占城市建设用地的0.28%,人均0.51平方米。

第58条公共设施规划建设项目表

第八章综合交通规划

第59条分区对外交通规划

59-1 规划目标:建立一个进出快捷、联系方便、过境快速的对外交通系统。

59-2 规划原则:

59-2-1对外交通体系注重公路、铁路和市域骨干路网的衔接和协调发展,以提高开发区的对外交通能力。

59-2-2对外交通的组织方式突出外快内迅的特点,过境公路强调快的特性。

59-3 规划措施

59-3-1高速公路:充分利用杭金衢高速公路在本规划区北部的互通口,通过拓宽改造白汤下公路,使车流便捷地上、下这个互通口。

59-3-2 省道、县道:

46省道:为一级公路,规划红线宽度41米;是龙游至兰溪的主要通道,是金西经济开发区及洋埠、罗埠镇对外交通主要道路,也是金华市公路网规划——区域干线网“八快”中“龙游——兰溪——郑家坞”公路(S46、S47)中的一段。

白汤下公路:为一级公路,规划红线宽度43米。

虹戴公路:为县道,规划红线宽度60米。白汤下公路、虹戴公路是中心城通往金西经济开发区的主要交通道路。

59-3—3杭长线金西段方案位于金西产业带上,为配合国家建设,本规划根据方案预留用地,有关关系见规划图。

59-3—4远期将建设联系金西、市区和金东的城市轨道交通,本规划建议在峙垄水库西北角的商业办公区,结合公共设施布局,规划布置轨道站点。

59-3—5客、货运站场规划:根据本规划区的人口和用地规模,规划2个长途客运站,分别位于北区块洋埠镇46省道北侧,汤溪镇区汤南路南侧,总面积2.59公顷;规划1个货运站,位于南区块汤南路南侧、九峰移民新村以东,面积为2.38公顷。第60条分区道路交通规划建设目标

以现状城市道路网为基础,调整、完善城市道路网结构和布局,优化路网的交通功能,充分考虑分区发展特点及建设要求,对分区道路交通体系进行综合规划,逐步建成与总体布局相协调、与发展目标相适应,布局合理、快速通畅的道路交通系统。

第61条分区道路交通组织

分区道路采用自由方格网为主的形式,道路等级划分为区域性干道(快速路)、主干道、次干路和支路四个等级。第62条主干道(交通性)

城市主干道功能为集聚和疏导交通,为片区内部及相邻片区的机动车提供通道,承担城市内部交通与城市对外交通的转换。主干道间距1000~1200米,道路红线宽度控制为40~60米,双向4~6车道,以6车道为主,机非分隔,两侧设“港湾式”公交站。各条城市主干道详述如下:

62-1 46省道:道路红线宽41米,道路长7.91千米,是联系兰溪市与龙游县的一条主干道。该道路为一级公路。

62-2 虹戴公路:为分区城市主干道,红线宽度为60米,在本规划区段道路长10.71千米(为宾虹路延伸)。

62-3 金西大道:道路红线宽度40米,道路长9.58千米,是本规划区东西向主干道。该道路与浙赣铁路交叉口设立体交叉。 62-4 汤南路:道路红线宽度30米,道路长9.07千米,是分区内启动区与东、南区东西向联系的主要道路。

62-5 经发街:道路红线宽40米,道路长3.45米,是规划区南北轴线,兼有景观道路功能。该道路与浙赣电气化铁路交叉口设立体交叉。

62-6 白汤下公路:道路红线宽43米,道路长6.89千米,是整个分区与中心片区南北联系的主要道路。

第63条次干路(交通性)

对城市道路主骨架起补充作用,承担片区内部及片区之间短距离交通联系,分流主干道的交通。次干道间距500~700米,其红线宽度为40米以内,主要控制在20-30米,双向2~4车道,有条件片区争取4车道,机非分隔。只要道路红线宽度允许,都应设“港湾式”公交站。

第64条支路(生活性)

片区内交通联系道路,承担集疏交通流的作用,可以机非混行。规划支路间距一般为150~200米。

第65条金西分区道路规划详细情况一览表。

第66条道路规划控制要求

66-1 经批准的道路走向及红线宽度未经原审批机关批准不得调整修改。

66-2 道路红线内不得修建任何建筑物、构筑物及临时性建筑物。

66-3 支路除规划所示外不得直接与快速通道、主干路相接。

第67条道路横断面

根据规划道路的功能、等级及未来的交通量,对城市道路断面、红线宽度和车道数进行安排。

67-1 规划主干路的道路断面以三块板和四块板为主,即需设机非分隔带以实现机非分流,需设中央分隔带以实现机动车对向分流,少数路幅不足的道路可不设中央分隔带,而以划线代替,断面形式则为三块板。

67-2 次干路的道路断面以一块板为主,但必须保证机动车道数不小于4车道。

67-3 支路原则以一块板为主,机动车道数大于或等于两车道。

第68条道路交通设施规划

68-1城市主要平面交叉口规划

主次干道交叉口全部实行信号灯控制,对所有新建设的道路交叉口以及具备条件的交叉口进行交叉口展宽改造,增加进出交叉口的车道等措施,展宽段在距离交叉口70~100米范围内实施。

68-2 城市立体交叉口规划

第69条静态交通规划

分区2020年规划总人口10.80万人,根据《城市道路交通规划设计规范》的规定:公共停车场用地总面积可按规划人口每人0.8~1.0平方米计算,需要停车面积为8.64~10.80公顷,其中机动车停车场占80%-90%。机动车每个泊位按30平方米计,共计需要机动车泊位0.28万个;非机动车停车位每个停车位按1.5平方米计,共计需要非机动车停车位约8000个。第70条大中型公共停车场

表8 大中型公共停车场规划一览表

第71条小型公共停车场

小型机动车公共停车场泊位一般30~40个泊位,采用分散布局,服务半径200—300米,宜在详细规划阶段确定。30泊位以下的公共停车场,可通过管理手段由路边停车解决。

第72条加油站

规划本分区布局2座加油站,一座是现有的位于46省道南侧、另一座规划布置于金西大道南侧,两座总面积0.51公顷。

第73条公交站场

分区共规划公交站场6处,总面积3.12公顷。分别位于汤溪老镇区汤南路南侧,金西经济大道南侧,南区块南面,北区块洋埠镇区,北区块罗埠镇区下章村东侧和北区块厚大溪以西、高速公路以北。

第九章竖向规划

第74条竖向设计原则

74—1 保持原生态地形(主要指水库水体和溪流):峙垄水库周围(中心绿核)、水库周围山地,其他有必要保护的原生态地形。74—2 削峰填谷,处理成缓坡或小台地。

第75条竖向设计

为了防洪排涝需要本次规划分别按不同地段基地高程规划,北区规划地基高程按33.4—37.2米控制;浙赣铁路以南区域按40—80米之内控制,并与现状的白汤下公路、虹戴公路、金西经济大道、经发街以及东区块、北区块已经完成设计的道路标高进行衔接。

道路标高:规划区内道路标高按照竖向规划图设计标高执行。道路最小纵坡不小于度0.3%,最大纵坡不大于度5%。

第十章绿地系统规划

第76条规划目标

重视城市自然环境特征,充分利用山体田园水系,构建由生态绿地、城市绿地及生态水网共同构成的绿色空间网络体系,用绿化网络将城市连为一体。将分区建设成山水相依、环境优美的新城。

合理确定城市绿地规模与指标。规划分区绿地率30%以上。

第77条绿地布局结构

结合规划区的自然地理条件,规划城市绿地采用点状、线状、带状绿地、面状绿化和背景山体水体相结合的布局方法。

以“一心、一轴、一区、两带”为分区生态绿化框架,构筑以峙垄水库为生态核心,城市景观中轴为纽带,以线状的道路、干渠绿化为骨架,以公园和大范围均匀分布的点状绿地为重点,田园山水融汇的网状绿色空间系统。

一心:峙垄水库生态核心;

一轴: 城市景观中轴;

一区:城市公共建筑景观区;

两带:厚大溪和莘畈溪生态景观带。

第78条公园绿地

规划公园分为区级公园与居住区级公园,其中居住区级公园在详细规划阶段,规划区级公园3处;分别位于东片区经发街东侧、北片区上章村西侧及北区罗埠集镇西面。

第79条街头绿地

街头绿地、小游园主要提供居民日常游憩之用,街头绿地的设置以尽可能结合河流岸线,以分布均匀、方便使用到达为原则,面积大的可作为片区的综合性游憩小公园或布置一些主题性设施,面积较小的作为街头绿地,以绿化为主。

第80条防护绿地

防护绿地包括园林生产绿地、河网水系防护绿地、卫生隔离带、道路防护绿地、城市高压走廊绿带等。河网水系防护绿地根据河道宽度确定两侧绿廊宽度,一般要求为5—15米。铁路隔离带的防护林带宽度单侧不少于50米。

沿杭金衢高速公路两侧设置不小于50米宽的防护绿带,白汤下公路西侧设置15米宽的绿化带,琳湖路东侧设置30米宽的防护绿带。

规划绿地145.95公顷,占城市建设用地7.31%,人均13.51平方米;其中公共绿地128.89公顷,占城市建设用地6.46%,人均11.93平方米。

第十一章空间景观规划

第81条规划目标

充分利用丰富的历史人文资源和自然景观资源,运用城市设计的理论与方法,形成具有时代特征,金西特色的空间景观体系,创造以生态宜居城市和历史人文资源为特征,独具风格的城市形象。

第82条规划原则

82—1 突出自然特征,创造依山临水的城市景观特色。

82—2 尊重人文历史和重视城市文化的时空延续,塑造具有浓厚文化品味的城市空间环境。

82—3 富有创意,形成现代城市重点突出、丰富有序、多样统一的空间形象。

82—4 以人为本,加强城市的视觉感知和城市空间的适宜尺度。

第83条空间景观构成

83—1 景观结构:景观系统依托分区内人文资源和自然风光,以峙垄水库区域中心区为景观核心,强化城市中心自然、人文与现代气息交相辉映的空间景观,通过厚大溪、金西大道、白汤下公路、经发街等景观轴线,联系城市放射生长轴上的公共中心、城市公园等景观节点,形成一核居中、多点环绕、轴线相联的城市空间景观网络。

83—2 核心区空间景观

景观核心以峙垄水库为视觉中心,厚大溪、莘畈溪、虹戴公路两侧的农业观光区等自然风光为空间界面,通过标志性高层建筑和广场、绿地的开敞空间充分展现金西经济分区的空间景观。围绕峙垄水库周边绿化广场,构筑金融商贸类的多(高)层建筑群。以北区块公共中心、启动区块开发区行政中心、汤溪老镇公共中心及南区块公共中心形成贯穿于金西开发区南北的公建景观带。通过高层建筑的挺拔,多层建筑的丰富轮廓和低层文化建筑的形体变化,使景观核心的建筑景观在分区内表现出功能的侧重和空间的特征,体现金西开发区具有时代特征的都市风貌。

汤溪城隍庙文物古迹是有城市历史文化价值的人文景观标志,通过古建本身的保护及其历史环境的维护和修复,以特有的人文环境和历史氛围,建立鲜明的空间特征,展示金西济开发区以清文化为主题的城市历史,丰富城市空间景观内涵。

83—3 空间景观节点

分区内以行政中心,生态公园、城市出入口、商业广场等为主体组成核心区外围的空间景观节点。

在各公共中心内部组织广场、步行街等开敞空间,设立中心标志,共同创造具有新区形象和环境自然优美的城市节点。

83—4景观轴线

白汤下公路、经发街和金西大道绿带为城市景观轴线,联系景观核心与城市节点。通过强化节点的功能布局和景观组织,形成以广场、街边(心)花园等为开敞空间的建筑布局,避免沿街公建没有主次的线性蔓延,产生轴线景观序列的起伏变化。白汤下公路、经发街为南北向主干大道,分区西侧新规划的道路南端对景九峰山,将城市山林背景引入城中。联结北区公共副中心节点、景观核心和南区公共副中心节点,形成轴线上一主二次的空间景观序列。通过连续、开敞的绿地空间和建筑层次、体形的变化,形成以山体、绿化等自然景观为前景,城市人工景观为背景的连续渐变空间序列。

83—5 景观界面

规划重视街道的景观设计,通过控制地域特色绿化种植、路面铺装、街道小品、道路照明、沿街建筑等诸多要素,创造尺度宜人、特色鲜明的高品质街道景观,作为重要的公共活动空间。沿街建筑是构成街道景观的主要因素,要求建筑布局严谨而不失变化,通过建筑平面的退让关系,形成沿街若干开放空间节点,成为景观构成的骨架。建筑立面高低错落,建筑风格、尺度的协调统一,形成沿街完整的景观界面。

第84条空间景观控制

城市的更新与发展,必须从城市空间景观整体性出发,进行控制与引导,保持城市视觉形象的连续性和合理性,体现城市应有的空间景观价值。

84—1 城市轮廓线控制

金西开发区城市外围的自然山体有优美的山脊轮廓线,九峰山是城市主要的自然景观标志,是城市轮廓线的背景与支持。城市建筑轮廓线必须与山体轮廓线有机结合,合理交织,使山体自然景观得到充分的展示。城市高层建筑相对集中成团成组发展,避免连续的高层建筑带。以起伏的山脊线,集中发展的城市主次高点建筑和公园、绿带的形态,形成特征鲜明、层次丰富的城市轮廓线。沿峙垄水库建筑顺应功能布局,以公共主中心(峙垄水库周边高层建筑)为制高点向次中心的次高点(北面的管委会行政中心与南面的汤溪镇公共中心)过渡,形成“山”字型水域(水库)建筑轮廓线。

84—2 景观视线走廊控制

以视线可达为标准,规定相应的视线走廊空间,由视线建立起人与自然景观、人工景观之间的联系。利用金西经济大道、经发街、广场、绿地等开敞空间联系城市中主要的景观标志点,建立分区城市中心与自然山水、人文历史之间的空间联系,成为体现城市空间景观特征的视线通廊。广场、步行街、林荫道、城市公园、街头花园等开敞空间,按规划相对集中布置在城市的主次公共中心,形成以广场、公园为主体,小绿地、花园相互呼应的开敞空间体系;并成为空间联系,景观组织的视线通廊。视廊中应突出标志景观点的地位,保护城市山体、水系、绿地等自然景观和人文历史景观,与之相关、相邻的人工建筑景观与其协调,通过开敞空间的布置保持自然景观、人文景观与建筑景观的视线连续,在空间分布上构成行进的景观序列。

第十二章城市设计导引

第85条规划原则

85-1整体性和独创性相结合的原则,创造独具特色的景观环境;

85-2 充分重视开放空间和道路作为空间构图骨架的作用,注重道路和开放空间的界面设计;

85-3生态环境与人工环境相结合,充分尊重自然生态环境;

85-4 构筑现代化城市环境,坚持“以人文本”的原则。

第86条总体结构

构筑以峙垄水库为核心,杭金衢高速公路、金西大道、白汤下路、琳湖街和汤南路为骨架,结合分区自然山水条件将其总体景观结构确定为“一核、五界面、多节点”;结合功能布局与景观资源的分布确立多级景观节点体系,以城市道路为联系将自然景观资源与人文景观资源纳入一个整体,建立一个人与自然互动的景观体系。

第87条结构要素导控

87-1 背景山体水系保护

87-2 分区景观核心

规划通过划定水域保护线、生态绿地控制线,有效保证峙垄水库的生态环境。选择乡土植物保持改善现状生态环境。 87-3 道路景观界面

景观道路的建设应结合两侧用地功能的组织发展不同的特色,注意其街廓平立面的变化,保持沿线的建筑风格的统一,道路沿线的景观节点是设计中的重点,应保持各个景观节点之间的视线通畅性。根据道路职能的不同,在景观塑造方面有着不同的侧重点。

87-3-1 交通性景观道路:主要以组织车行景观为主,两侧绿化注重形象性,人流活动宜在一侧组织减少步行人流车流交叉。杭金衢高速公路、浙赣铁路、46省道、虹戴公路、金西大道、汤南路、白汤下路等主干道是城市的重要观赏面,应注意两侧绿化隔离带,注意两侧立面的变化,天际轮廓线的设计。

87-3-2 生活性景观道路:主要以组织人行景观为主,绿化设计应与两侧用地综合考虑,强调人的可进入性。主要为城市的次干道、支路。

87 -4 景观节点的建设

在分区的重要节点处进行景观建设,既可以突出分区的整体形象,也可以使整个分区形成一个优美的环境;在分区的主要出入口、行政中心、文化中心、商业中心和大型的居住小区进行景观节点的布置和建设,结合周边的环境加以设计,突出当地的文化和形象,成为城市整体形象的“代言人”。

第十三章文物古迹保护规划

第88条金西开发区分区的文物保护单位1处——汤溪镇内的城隍庙,属省级文物保护单位。

第89条严格按照《中华人民共和国文物保护法》的有关规定,划定文物保护范围,加强对文物古迹的修缮、维护,对其周边地区的建设进行控制。

第90条在文物保护单位保护范围内的所有文物建筑(包括附属设施)必须严格予以保护,不得损毁和破坏原有风貌,也不得改建、拆建和占作它用。

在文物保护单位保护建设控制地带的建设项目,其体型、体量和风格等,应与文物建筑相协调,必要时应报送市政府文物主管部门和规划行政主管部门审查批准。

第91条文物古迹保护措施

91—1划定紫线(文物古迹保护范围控制线);

91—2 现有居民有条件迁出时,鼓励迁出;

91—3 居民迁出后,历史建筑可作为公共活动场所;

91—4 紫线范围内除主体建筑用地外,鼓励作为绿地、广场等进行利用。

第十四章四线规划控制导则

第92条四线规划控制体系内容

四线规划控制体系包括:绿线控制图——绿地范围规划控制图、蓝线控制图——水域岸线规划控制图、紫线控制图——历史文物保护规划控制图、黄线控制图——市政公用设施规划控制图。

第93条绿线系统导控

93-1绿线的划定:绿线是规划中用于界定公共绿地、防护绿地等非城市建设用地范围的控制线,广义上将规划区范围内非城镇建设区统称为生态区,故绿线也是生态环境控制线。

93-2 绿线导控要点:将分区内的绿线控制区划分为生态绿地、公共绿地、防护绿地。生态控制区是指以生态自然保护为主导的地区;公共绿地是指向公众开放、以供休闲游憩为主要功能的绿地,可以进行低强度开发建设的地区;防护绿地是指以隔离、卫生和安全为主要功能的绿地。

第94条蓝线系统导控

数据仓库与及数据挖掘文本分类实验报告

2015-2016学年第1学期实验报告 课程名称:数据仓库与及数据挖掘实验名称:文本的分类 实验完成人: 姓名:学号:

日期: 2015年 12月 实验一:文本的分类 1.实验目的 1)掌握数据预处理的方法,对训练集数据进行预处理; 2)掌握文本建模的方法,对语料库的文档进行建模; 3)掌握分类算法的原理,基于有监督的机器学习方法,训练 文本分类器; 4)利用学习的文本分类器,对未知文本进行分类判别; 5)掌握评价分类器性能的评估方法 2.实验分工 独立完成 3.实验环境 基于Windows平台,使用eclipse开发。 4.主要设计思想 4.1实验工具介绍 Eclipse:一个开放源代码的/基于Java的可扩展开发平

台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。Eclipse最早是由IBM开发的,后来IBM将Eclipse作为一个开放源代码的项目发布。现在Eclipse 在https://www.wendangku.net/doc/5b1484049.html,协会的管理与指导下开发。 4.2特征提取与表达方法的设计 在此次实验中,我考虑了CHI特征提取的方法来建立数据字典。详细步骤见5.3描述。根据CHI特征提取,最终建立成数据字典,数据字典记录在目录E:\DataMiningSample\docVector下的allDicWordCountMap.txt 文档中。 最终的特征向量表达方式为:文档类别标识_单词词频。如:alt.atheism_abstact 1.0。其中alt.atheism为此文本所属的类别,abstact为对应的单词,1.0为该单词的词频数。 4.3分类算法的选择 本次实验使用的是朴素贝叶斯分类算法,朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相互条件独立。即: Document) P(Document P(Category | | * nt) Category) )/P(Docume P(Category 朴素贝叶斯模型:

文本分类综述

山西大学研究生学位课程论文(2014 ---- 2015 学年第 2 学期) 学院(中心、所):计算机与信息技术学院 专业名称:计算机应用技术 课程名称:自然语言处理技术 论文题目:文本分类综述 授课教师(职称):王素格(教授) 研究生姓名:刘杰飞 年级:2014级 学号:201422403003 成绩: 评阅日期: 山西大学研究生学院 2015年 6 月2日

文本分类综述 摘要文本分类就是在给定的分类体系下,让计算机根据给定文本的内容,将其判别为事先确定的若干个文本类别中的某一类或某几类的过程。文本分类在冗余过滤、组织管理、智能检索、信息过滤、元数据提取、构建索引、歧义消解、文本过滤等方面有很重要的应用。本文主要介绍文本分类的研究背景,跟踪国内外文本分类技术研究动态。介绍目前文本分类过程中的一些关键技术,以及流形学习在文本分类中降维的一些应用。并且讨论目前文本分类研究面临的一些问题,及对未来发展方向的一些展望。 关键词文本分类;特征选择;分类器;中文信息处理 1.引言 上世纪九十年代以来,因特网以惊人的速度发展起来,到现在我们进入大数据时代互联网容纳了海量的各种类型的数据和信息,包括文本、声音、图像等。这里所指的文本可以是媒体新闻、科技、报告、电子邮件、技术专利、网页、书籍或其中的一部分。文本数据与声音和图像数据相比,占用网络资源少,更容易上传和下载,这使得网络资源中的大部分是以文本(超文本)形式出现的。如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一大挑战。基于机器学习的文本分类系统作为处理和组织大量文本数据的关键技术,能够在给定的分类模型下,根据文本的内容自动对文本分门别类,从而更好地帮助人们组织文本、挖掘文本信息,方便用户准确地定位所需的信息和分流信息。 利用文本分类技术可以把数量巨大但缺乏结构的文本数据组织成规范的文本数据,帮助人们提高信息检索的效率。通过对文本信息进行基于内容的分类,自动生成便于用户使用的文本分类系统,从而可以大大降低组织整理文档耗费的人力资源,帮助用户快速找到所需信息。因此文本分类技术得到日益广泛的关注,成为信息处理领域最重要的研究方向之一。 2.文本分类技术的发展历史及现状 2.1文本分类技术发展历史 国外自动分类研究始于1950年代末,早期文本分类主要是基于知识工程,通过手工定义一些规则来对文本进行分类,这种方法费时费力,还需要对某一领域有足够的了解,才能提炼出合适的规则。H.P.Luhn在这一领域进行了开创性的研究,他将词频统计的思想用于文本分类中。这一时期,主要是分类理论的研究,并将文本分类应用用于信息检索。在这一段时期,提出了很多经典文本分类的数学模型。比如1960年Maron在Journal of ASM上发表了有关自动分类的第一篇论文“On relevance Probabilitic indexing and informarion retriral”,这是Maron和Kuhns提出概的率标引(Probabilitic indexing )模型在信息检

文本挖掘基础

文本挖掘(Text mining)基础- Presentation Transcript 1.文本挖掘(Text Mining )技术基础出家如初, 成佛有余https://www.wendangku.net/doc/5b1484049.html, 20 10 年10 月 2.议题 o搜索引擎文本挖掘基础 o文本挖掘基础 3.搜索引擎技术不单纯只是搜索 o搜索引擎技术除了实现Web 搜索、图片搜索外,还能够干什么? o搜索引擎核心技术有哪些? ?网络爬虫 ?中英文分词 ?排序算法 ?Text Mining 相关 ?海量数据存储 ?分布式计算 ?等等 4.Google 的十大核心技术 o Google 的十大核心技术: ?分布式基础设施: ?GFS 、Chubby 、Protocol Buffer ?分布式大规模数据处理 ?MapReduce、Sawzall ?分布式数据库技术: ?BigTable、Sharding ?数据中心优化技术 ?数据中心高温化、12V 电池、服务器整合 ?参考:探索Google App Engine 背后的奥秘 5.搜索引擎技术使用场景:内容相似度 o新闻站点的“您可能也喜欢” ?本质为:两篇文档/ 图书/ 商品内容的相似度 6.搜索引擎技术使用场景:内容分类、聚类 7.通用搜索引擎系统流程 8.Lucene系统架构 9.Lucene系统架构 10.搜索引擎中文本挖掘典型问题 o在搜索引擎中关于文本挖掘的典型问题 ?怎样得到一篇文章的关键词、主题? ?怎样用计算机可识别的数学公式来表征一篇文档 ?怎样处理查询关键词与文档的相似度 ?怎样度量两篇文档的相似度? 11.信息检索模型 o信息检索模型(Information Retrieval Model )是指如何对查询和文档进行表示,然后对它们进行相似度计算的框架和方法。

基于机器学习的文本分类方法

基于机器学习算法的文本分类方法综述 摘要:文本分类是机器学习领域新的研究热点。基于机器学习算法的文本分类方法比传统的文本分类方法优势明显。本文综述了现有的基于机器学习的文本分类方法,讨论了各种方法的优缺点,并指出了文本分类方法未来可能的发展趋势。 1.引言 随着计算机技术、数据库技术,网络技术的飞速发展,Internet的广泛应用,信息交换越来越方便,各个领域都不断产生海量数据,使得互联网数据及资源呈现海量特征,尤其是海量的文本数据。如何利用海量数据挖掘出有用的信息和知识,方便人们的查阅和应用,已经成为一个日趋重要的问题。因此,基于文本内容的信息检索和数据挖掘逐渐成为备受关注的领域。文本分类(text categorization,TC)技术是信息检索和文本挖掘的重要基础技术,其作用是根据文本的某些特征,在预先给定的类别标记(label)集合下,根据文本内容判定它的类别。传统的文本分类模式是基于知识工程和专家系统的,在灵活性和分类效果上都有很大的缺陷。例如卡内基集团为路透社开发的Construe专家系统就是采用知识工程方法构造的一个著名的文本分类系统,但该系统的开发工作量达到了10个人年,当需要进行信息更新时,维护非常困难。因此,知识工程方法已不适用于日益复杂的海量数据文本分类系统需求[1]。20世纪90年代以来,机器学习的分类算法有了日新月异的发展,很多分类器模型逐步被应用到文本分类之中,比如支持向量机(SVM,Support Vector Machine)[2-4]、最近邻法(Nearest Neighbor)[5]、决策树(Decision tree)[6]、朴素贝叶斯(Naive Bayes)[7]等。逐渐成熟的基于机器学习的文本分类方法,更注重分类器的模型自动挖掘和生成及动态优化能力,在分类效果和灵活性上都比之前基于知识工程和专家系统的文本分类模式有所突破,取得了很好的分类效果。 本文主要综述基于机器学习算法的文本分类方法。首先对文本分类问题进行概述,阐述文本分类的一般流程以及文本表述、特征选择方面的方法,然后具体研究基于及其学习的文本分类的典型方法,最后指出该领域的研究发展趋势。 2.文本自动分类概述 文本自动分类可简单定义为:给定分类体系后,根据文本内容自动确定文本关联的类别。从数学角度来看,文本分类是一个映射过程,该映射可以是一一映射,也可以是一对多映射过程。文本分类的映射规则是,系统根据已知类别中若干样本的数据信息总结出分类的规律性,建立类别判别公式或判别规则。当遇到新文本时,根据总结出的类别判别规则确定文本所属的类别。也就是说自动文本分类通过监督学习自动构建出分类器,从而实现对新的给定文本的自动归类。文本自动分类一般包括文本表达、特征选取、分类器的选择与训练、分类等几个步骤,其中文本表达和特征选取是文本分类的基础技术,而分类器的选择与训练则是文本自动分类技术的重点,基于机器学习的文本分来就是通过将机器学习领域的分类算法用于文本分类中来[8]。图1是文本自动分类的一般流程。

数据挖掘中分类技术应用

分类技术在很多领域都有应用,例如可以通过客户分类构造一个分类模型来对银行贷款进行风险评估;当前的市场营销中很重要的一个特点是强调客户细分。客户类别分析的功能也在于此,采用数据挖掘中的分类技术,可以将客户分成不同的类别,比如呼叫中心设计时可以分为:呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他,帮助呼叫中心寻找出这些不同种类客户之间的特征,这样的分类模型可以让用户了解不同行为类别客户的分布特征;其他分类应用如文献检索和搜索引擎中的自动文本分类技术;安全领域有基于分类技术的入侵检测等等。机器学习、专家系统、统计学和神经网络等领域的研究人员已经提出了许多具体的分类预测方法。下面对分类流程作个简要描述: 训练:训练集——>特征选取——>训练——>分类器 分类:新样本——>特征选取——>分类——>判决 最初的数据挖掘分类应用大多都是在这些方法及基于内存基础上所构造的算法。目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展能力。 神经网络 神经网络是解决分类问题的一种行之有效的方法。神经网络是一组连接输入/输出单元的系统,每个连接都与一个权值相对应,在将简单的单元连接成较复杂的系统后,通过并行运算实现其功能,其中系统的知识存储于网络结构和各单元之间的连接权中。在学习阶段,通过调整神经网络的权值,达到对输入样本的正确分类。神经网络有对噪声数据的高承受能力和对未经训练数据的模式分类能力。神经网

络概括性强、分类精度高,可以实现有监督和无监督的分类任务,所以神经网络在分类中应用非常广泛。 在结构上,可以把一个神经网络划分为输入层、输出层和隐含层(见图4)。网络的每一个输入节点对应样本一个特征,而输出层节点数可以等于类别数,也可以只有一个,(输入层的每个节点对应一个个的预测变量。输出层的节点对应目标变量,可有多个)。在输入层和输出层之间是隐含层(对神经网络使用者来说不可见),隐含层的层数和每层节点的个数决定了神经网络的复杂度。 除了输入层的节点,神经网络的每个节点都与很多它前面的节点(称为此节点的输入节点)连接在一起,每个连接对应一个权重Wxy,此节点的值就是通过它所有输入节点的值与对应连接权重乘积的和作为一个函数的输入而得到,我们把这个函数称为活动函数或挤压函数。如图5中节点4输出到节点6的值可通过如下计算得到:

基于TAN结构的贝叶斯文本分类器

2012.1 53 基于TAN 结构的贝叶斯 文本分类器研究 王景中 易路杰 北方工业大学信息工程学院 北京 100144 摘要:朴素贝叶斯分类器是一种简单且有效实现的文本自动类方法,但其独立性假设在实际中是不存在的。在TAN 结构贝叶斯分类算法中,考虑了两两属性间的关联性,对属性间的独立性假设有了一定程度的降低。 关键词:文本分类;贝叶斯;TAN 0 引言 朴素贝叶斯分类器是贝叶斯分类中一种最常见且原理简单,实际应用很成功的方法。朴素贝叶斯分类器中的“朴素”主要是指假设各属性间相互独立。在文本分类中,假设不同的特征项在确定的类别下的条件概率分布相互独立,这样在计算特征项之间的联合分布概率时可以大大提高分类器的速度。目前,很多文本分类系统都采用贝叶斯分类算法,在邮件分类、电子会议、信息过滤等方面都有了广泛的应用。 1 朴素贝叶斯分类器 1.1 贝叶斯公式介绍 贝叶斯定理为:设S 为试验E 的样本空间,A 为E 的事件,1B ,2B ,…n B 为S 的一个划分,且有P(A)>0,P(i B )>0 (i=1,2,…n),则有: 1 (/)() (/)(/)() i i i n j j j P A B P B P B A P A B P B ==∑ ,i=1,2,…n 。 1.2 贝叶斯文本分类 贝叶斯文本分类模型是一种基于统计方法的分类模型,是现有文本分类算法中最有效的方法之一。其基本原理是:通过样本数据的先验概率信息计算确定事件的后验概率。在文本分类中的应用为:通过计算给定文本的特征值在样本库中某一确定类i C 中的先验概率, 得出给定文本的特征值属于 i C 类的后验概率,再通过比较,得出后验概率最大的即为给 定文本最可能属于的类别。因此,贝叶斯类别判别式为: 12arg max (/,,)NB i n C P C w w w = (1) 本文采用布尔表示法描述文本,每个文本表示为特征矢 量(1w ,2w , …V w ),V 为特征词表,V 为特征词表总词数,V=(1B ,2B ,…V B )。特征矢量中的i w ={0,1},1表示特 征词表中的第i 个词出现,0表示没有出现。 根据贝叶斯公式: 121212(,,/)() (/,,)(,,) n i i i n n P w w w C P C P C w w w P w w w = (2) 式中()i P C 为样本集中属于i C 类的概率,12(,,/)n i P w w w C …为i C 类中给定文本特征词的概率。 要求12max (/,,)i n P C w w w …,(2)式中分母12(,,)n P w w w …在给定的所有类别中为固定值,即为常量。因此,只需求: 12arg max (,,/)()NB n i i C P w w w C P C = (3) 式中()i P C 的值为每个类别在样本集中的频率,即为样本集中属于i C 类的文本数与样本集中的总的文本数的比率。12(,,/)n i P w w w C …的值计算比较困难,理论上只有建立一个 足够大的样本集才能准确得到。如何得出12(,,/)n i P w w w C …的值也是贝叶斯算法的关键,直接影响分类的性能。目前只能通过估算得出。 由于贝叶斯分类模型的假设,文本特征属性之间独立同分布,因此各属性联合概率等于各属性概率的乘积,即:

中文文本分类算法设计及其实现_毕业设计

毕业设计(论文)任务书 毕业设计(论文) 题目中文文本分类算法的设计及其实现 电信学院计算机系84班设计所在单位西安交通大学计算机系

西安交通大学本科毕业设计(论文) 毕业设计(论文)任务书 电信学院计算机系84 班学生丰成平 毕业设计(论文)工作自2013 年 2 月21 日起至2013 年 6 月20 日止毕业设计(论文)进行地点:西安交通大学 课题的背景、意义及培养目标 随着文本文件的增多,对其自动进行分门别类尤为重要。文本分类是指采用计算机程序对文本集按照一定的分类体系进行自动分类标记。文本分类器的设计通常包括文本的特征向量表示、文本特征向量的降维、以及文本分类器的设计与测试三个方面。本毕设论文研究文本分类器的设计与实现。通过该毕业设计,可使学生掌握文本分类器设计的基本原理及相关方法,并通过具体文本分类算法的设计与编程实现,提高学生的实际编程能力。 设计(论文)的原始数据与资料 1、文本语料库(分为训练集与测试集语料库)。 2、关于文本分类的各种文献(包括特征表示、特征降维、以及分类器设计)以及资料。 3、中科院文本分词工具(nlpir)。 4、文本分类中需要用到的各种分类方法的资料描述。 课题的主要任务 1.学习文本特征向量的构建方法及常用的降维方法。 2.学习各种分类器的基本原理及其训练与测试方法。 3.设计并编程实现文本分类器。

毕业设计(论文)任务书 4、对试验结果进行分析,得出各种结论。 5、撰写毕业论文。 6、翻译一篇关于文本分类的英文文献。 课题的基本要求(工程设计类题应有技术经济分析要求) 1、程序可演示。 2、对源代码进行注释。 3、给出完整的设计文档及测试文档。 完成任务后提交的书面材料要求(图纸规格、数量,论文字数,外文翻译字数等) 1、提交毕业论文 2、提交设计和实现的系统软件源程序及有关数据 3、提交外文资料翻译的中文和原文资料 主要参考文献: 自然语言处理与信息检索共享平台:https://www.wendangku.net/doc/5b1484049.html,/?action-viewnews-itemid-103 Svm(支持向量机)算法:https://www.wendangku.net/doc/5b1484049.html,/zhenandaci/archive/2009/03/06/258288.html 基于神经网络的中文文本分析(赵中原):https://www.wendangku.net/doc/5b1484049.html,/p-030716713857.html TF-IDF的线性图解:https://www.wendangku.net/doc/5b1484049.html,/blog-170225-6014.html 东南大学向量降维文献:https://www.wendangku.net/doc/5b1484049.html,/p-690306037446.html 指导教师相明 接受设计(论文)任务日期2013-02-21~2013-06-20 学生签名:

结合中文分词的贝叶斯文本分类

结合中文分词的贝叶斯文本分类 https://www.wendangku.net/doc/5b1484049.html,/showarticle.aspx?id=247 来源:[] 作者:[] 日期:[2009-7-27] 魏晓宁1,2,朱巧明1,梁惺彦2 (1.苏州大学,江苏苏州215021;2.南通大学,江苏南通226007) 摘要:文本分类是组织大规模文档数据的基础和核心。朴素贝叶斯文本分类方法是种简单且有效的文本分类算法,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型,结合中文分词过程,引入特征词条权重,给出了改进Bayes方法。并由实验验证和应用本方法,文本分类的效率得到了提高。 1. Using Bayesian in Text Classification with Participle-method WEI Xiao-ning1,2,ZHU Qiao-ming1,LIANG Xing-yan2 (1.Suzhou University,Suzhou 215006,China;2.Nantong University,Nantong 226007,China) Abstract:Text classification is the base and core of processing large amount of document data.Native Bayes text classifier is a simple and effective text classification method.Text classification is the key technology in organizing and processing large amount of document data.The practical Bayes algorithm is an useful technique which has an assumption of strong independence of different properties.Based on the polynomial model,a way in feature abstraction considering word-weight and participle-method is introduced. At last the experiments show that efficiency of text classification is improved. 1.0引言 文档分类是组织大规模文档数据的基础和核心,利用计算机进行自动文档分类是自然语言处理和人工智能领域中一项具有重要应用价值的课题。现有的分类方法主要是基于统计理论和机器学习方法的,比较著名的文档分类方法有Bayes、KNN、LLSF、Nnet、Boosting及SVM等。 贝叶斯分类器是基于贝叶斯学习方法的分类器,其原理虽然较简单,但是其在实际应用中很成功。贝叶斯模型中的朴素贝叶斯算法有一个很重要的假设,就是属性间的条件独立[1][2],而现实中属性之间这种独立性很难存在。因此,本文提出了一种改进型的基于朴素贝叶斯网络的分类方法,针对于文本特征,结合信息增益于文本分类过程,实验表明文本分类的准确率在一定程度上有所提高。

文本分类入门(八)中英文文本分类的异同

从文本分类系统的处理流程来看,无论待分类的文本是中文还是英文,在训练阶段之前都要经过一个预处理的步骤,去除无用的信息,减少后续步骤的复杂度和计算负担。 对中文文本来说,首先要经历一个分词的过程,就是把连续的文字流切分成一个一个单独的词汇(因为词汇将作为训练阶段“特征”的最基本单位),例如原文是“中华人民共和国今天成立了”的文本就要被切分成“中华/人民/共和国/今天/成立/了”这样的形式。而对英文来说,没有这个步骤(更严格的说,并不是没有这个步骤,而是英文只需要通过空格和标点便很容易将一个一个独立的词从原文中区分出来)。中文分词的效果对文本分类系统的表现影响很大,因为在后面的流程中,全都使用预处理之后的文本信息,不再参考原始文本,因此分词的效果不好,等同于引入了错误的训练数据。分词本身也是一个值得大书特书的问题,目前比较常用的方法有词典法,隐马尔科夫模型和新兴的CRF方法。 预处理中在分词之后的“去停止词”一步对两者来说是相同的,都是要把语言中一些表意能力很差的辅助性文字从原始文本中去除,对中文文本来说,类似“我们”,“在”,“了”,“的”这样的词汇都会被去除,英文中的“ an”,“in”,“the”等也一样。这一步骤会参照一个被称为“停止词表”的数据(里面记录了应该被去除的词,有可能是以文件形式存储在硬盘上,也有可能是以数据结构形式放在内存中)来进行。 对中文文本来说,到此就已初审合格,可以参加训练了(笑)。而英文文本还有进一步简化和压缩的空间。我们都知道,英文中同一个词有所谓词形的变化(相对的,词义本身却并没有变),例如名词有单复数的变化,动词有时态的变化,形容词有比较级的变化等等,还包括这些变化形式的某种组合。而正因为词义本身没有变化,仅仅词形不同的词就不应该作为独立的词来存储和和参与分类计算。去除这些词形不同,但词义相同的词,仅保留一个副本的步骤就称为“词根还原”,例如在一篇英文文档中,经过词根还原后,“computer”,“compute”,“computing”,“computational”这些词全都被处理成“compute”(大小写转换也在这一步完成,当然,还要记下这些词的数目作为compute的词频信息)。 经过预处理步骤之后,原始文档转换成了非常节省资源,也便于计算的形式,后面的训练阶段大同小异(仅仅抽取出的特征不同而已,毕竟,一个是中文词汇的集合,一个是英文词汇的集合嘛)。 下一章节侃侃分类问题本身的分类。

中文文本分类语料

中文文本分类语料 文本自动分类就是用电脑对文本按照一定的分类体系或标准进行自动分类标记。 文本分类问题与其它分类问题没有本质上的区别,其方法可以归结为根据待分类数据的某些特征来进行匹配,当然完全的匹配是不太可能的,因此必须(根据某种评价标准)选择最优的匹配结果,从而完成分类。现如今,统计学习方法已经成为了文本分类领域绝对的主流。 统计学习方法需要一批由人工进行了准确分类的文档作为学习的材料(称为训练集,注意由人分类一批文档比从这些文档中总结出准确的规则成本要低得多),计算机从这些文档中挖掘出一些能够有效分类的规则,这个过程被形象的称为训练,而总结出的规则集合常常被称为分类器。训练完成之后,需要对计算机从来没有见过的文档进行分类时,便使用这些分类器来进行。 下面提供一些网上能下载到的中文的好语料,供研究人员学习使用。 1.中科院自动化所的中英文新闻语料库https://www.wendangku.net/doc/5b1484049.html,/data/13484 中文新闻分类语料库从凤凰、新浪、网易、腾讯等版面搜集。英语新闻分类语料库为Reuters-21578的ModApte版本。 2.搜狗的中文新闻语料库https://www.wendangku.net/doc/5b1484049.html,/labs/dl/c.html 包括搜狐的大量新闻语料与对应的分类信息。有不同大小的版本可以下载。 3.李荣陆老师的中文语料库 https://www.wendangku.net/doc/5b1484049.html,/data/11968 压缩后有240M大小 4.谭松波老师的中文文本分类语料https://www.wendangku.net/doc/5b1484049.html,/data/11970 不仅包含大的分类,例如经济、运动等等,每个大类下面还包含具体的小类,例如运动包含篮球、足球等等。能够作为层次分类的语料库,非常实用。 5.网易分类文本数据https://www.wendangku.net/doc/5b1484049.html,/data/11965 包含运动、汽车等六大类的4000条文本数据。 6.中文文本分类语料https://www.wendangku.net/doc/5b1484049.html,/data/11963 包含Arts、Literature等类别的语料文本。 7.更全的搜狗文本分类语料 https://www.wendangku.net/doc/5b1484049.html,/labs/dl/c.html 搜狗实验室发布的文本分类语料,有不同大小的数据版本供免费下载 8.2002年中文网页分类训练集https://www.wendangku.net/doc/5b1484049.html,/data/15021 2002年秋天北京大学网络与分布式实验室天网小组通过动员不同专业的几十个学生,人工选取形成了一个全新的基于层次模型的大规模中文网页样本集。它包括11678个训练网页实例和3630个测试网页实例,分布在11个大类别中。

文本数据挖掘及其应用

文本数据挖掘及其应用

文本数据挖掘及其应用 摘要:随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。本文首先对文本挖掘进行了概述包括文本挖掘的研究现状、主要内容、相关技术以及热点难点进行了探讨,然后通过两个例子简单地说明了文本挖掘的应用问题。 关键词:文本挖掘研究现状相关技术应用 1 引言 随着科技的发展和网络的普及,人们可获得的数据量越来越多,这些数据多数是以文本形式存在的。而这些文本数据大多是比较繁杂的,这就导致了数据量大但信息却比较匮乏的状况。如何从这些繁杂的文本数据中获得有用的信息越来越受到人们的关注。“在文本文档中发现有意义或有用的模式的过程"n1的文本挖掘技术为解决这一问题提供了一个有效的途径。而文本分类

技术是文本挖掘技术的一个重要分支,是有效处理和组织错综复杂的文本数据的关键技术,能够有效的帮助人们组织和分流信息。 2 文本挖掘概述 2.1文本挖掘介绍 数据挖掘技术本身就是当前数据技术发展的新领域,文本挖掘则发展历史更短。传统的信息检索技术对于海量数据的处理并不尽如人意,文本挖掘便日益重要起来,可见文本挖掘技术是从信息抽取以及相关技术领域中慢慢演化而成的。 1)文本挖掘的定义 文本挖掘作为数据挖掘的一个新主题引起了人们的极大兴趣,同时它也是一个富于争议的研究方向。目前其定义尚无统一的结论,需要国内外学者开展更多的研究以进行精确的定义,类似于我们熟知的数据挖掘定义。我们对文本挖掘作如下定义。 定义 2.1.1 文本挖掘是指从大量文本数据中抽取事先未知的可理解的最终可用的信息或知识的过程。直观地说,当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称为文

一种文本分类数据挖掘的技术

一种文本分类数据挖掘的技术 来源:网店装修 https://www.wendangku.net/doc/5b1484049.html, 摘要挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,本文介绍了一种文本数据挖掘方法。并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性。关键词文本挖掘;文本分类;数据挖掘;VSM 本文首先讨论了文本挖掘技术的定义、功能、分类等问题,接着重点研究了文本分类的关键理论问题,包括分词、特征提取、特征匹配等方面,并简述了我们开发的一个简单的文本分类系统的实验情况,最后是结束语。 1文本挖掘简介 1.1 文本挖掘的定义 文本挖掘作为数据挖掘的一个新主题,引起了人们的极大兴趣,同时,它也是一个富于争议的研究方向,目前其定义尚无统一的结论,需要国内外学者开展更多的研究以便进行精确地定义。类似于我们熟知的数据挖掘定义,我们对文本挖掘作如下定义。定义1:文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的信息或知识的过程。 直观的说,当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称为文本挖掘。文[1]已对Web挖掘与信息检索进行了比较研究,在此,我们不再详细讨论文本挖掘与信息检索的关系,我们认为随着文本挖掘技术研究的发展,将之应用到信息检索领域,必将能进一步提高信息检索的精度和效率。 1.2 文本挖掘的分类

文本挖掘从功能上可以分为总结、分类、聚类、趋势预测等。文本总结是指从文档中抽取关键信息,用简洁的形式对文档内容进行摘要或解释。从而用户不需要浏览全文就可以了解文档或文档集合的总体内容。文本总结在有些场合非常有用,例如,搜索引擎在向用户返回查询结果时,通常需要给出文档的摘要。目前,绝大部分搜索引擎采用的方法是简单地截取文档的前几行。 文本分类是指按照预先定义的分类体系,将文档集合的每个文档归入某个类别。这样,用户不但能够方便浏览文档,而且可以通过限制搜索范围来使文档的查找更为容易。目前,Yahoo仍然是通过人工对Web 文档进行分类,这大大限制了其索引页面的数目和覆盖范围。可以说研究文本分类有着广泛的商业前景和应用价值。 文本聚类与分类的不同在于,聚类没有预先定义的主题类别,是一种典型的无教师的机器学习问题。它的目标是将文档集合分成若干簇,且同一簇内的文档相似度尽可能大。聚类的结果可以用来指导分类。文[2,3]介绍了利用文档进行分布分析和趋势预测的情况。以上功能的研究在国外研究得比较的多,但都是基于英文环境的。在国内,数据挖掘研究者对中文文本的研究还刚刚开始,如何借鉴现有中文处理技术对文本进行挖掘仍有很多问题亟待解决。 2. 文本分类我们开发了一个简单的文本分类系统(STCS),下面分别介绍其中的各项关键技术。 2.1 文本信息的预处理在对文档进行特征提取前,需要先进行文本信息的预处理,对英文而言需进行Stemming处理,中文的情况则不同,因为中文词与词之间没有固有的间隔符,需要进行分词处理。在中文信息处理领域,对中文自动分词研究已经得比较多了,提出了一些分词方法,如最大匹配法、逐词遍历匹配法、最小匹配法等。文[4]中采用

基于libsvm的中文文本分类原型

基于libsvm的中文文本分类原型 支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)。SVM理论的学习,请参考jasper的博客。 LIBSVM 是台湾大学林智仁(Chih-Jen Lin)博士等开发设计的一个操作简单、易于使用、快速有效的通用SVM 软件包,可以解决分类问题(包括C?SVC 、ν?SVC ),回归问题(包括ε ? SVR 、v? SVR )以及分布估计(one ? class ? SVM ) 等问题,提供了线性、多项式、径向基和S 形函数四种常用的核函数供选择,可以有效地解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。LIBSVM是一个开源的软件包,。他不仅提供了LIBSVM 的C++语言的算法源代码,还提供了Python、Java、R、MATLAB、Perl、Ruby、LabVIEW以及C#.net 等各种语言的接口,可以方便的在Windows 或UNIX 平台下使用,也便于科研工作者根据自己的需要进行改进(譬如设计使用符合自己特定问题需要 的核函数等)。 更多案例到WX 公zhong hao : datadw 文本分类,大致分为如下几件事情:样本,分词,特征提取,向量计算,分类训练,测试和调试。 1.样本选择 搜狗语料https://www.wendangku.net/doc/5b1484049.html,/labs/dl/c.html,下精简版吧,如果实验用用,这足够了,你要下107M的也可以。当然,你也可以自己找语料,不过麻烦点而已,把各大门户网站的对应频道下的文章都爬下来。 2.分词

文本挖掘主要技术研究

文本挖掘主要技术研究 摘要:Web技术的发展日新月异,与此同时,因特网上的文本信息愈积愈多,浩如烟海。如何从这些海量文本数据挖掘出潜在的、有价值的信息,已经成为越来越多人的研究重点。本文主要介绍了文本挖掘的基本方法,包括文本特征提取、特征子集选取、文本分类、文本聚类等,并对这些方法的改进进行了分析。在此基础上,介绍了文本挖掘在当今一些领域的应用。 关键词:文本挖掘特征提取特征子集选取文本分类文本聚类应用 Research of Major Technologies in Text Mining 【Abstract】With the rapid development of Web technology, text information on the Internet has a tremendous growth. How to dig out the potential and valuable information from the text information on the Internet has become the focus of many people's research. This paper describes the basic methods of text mining, including text feature extraction, feature subset selection, text categorization, text clustering, etc., it makes some analysis on how to improve some of these methods. In addition, it introduces the application in some fields with text mining technology. 【Key words】text mining, feature extraction, feature subset selection, text categorization, text clustering, application

Text-CNN 文本分类

Text-CNN 文本分类 1.简介 TextCNN 是利用卷积神经网络对文本进行分类的算法,由Yoon Kim 在“Convolutional Neural Networks for Sentence Classification” 一文(见参考[1]) 中提出. 是2014年的算法. 图1-1 参考[1] 中的论文配图

图1-2 网络盗图 合理性: 深度学习模型在计算机视觉与语音识别方面取得了卓越的成就. 在NLP 也是可以的. 卷积具有局部特征提取的功能, 所以可用CNN 来提取句子中类似n-gram 的关键信息. 2.参数与超参数 ?sequence_length Q: 对于CNN, 输入与输出都是固定的,可每个句子长短不一, 怎么处理? A: 需要做定长处理, 比如定为n, 超过的截断, 不足的补0. 注意补充的0对后面的结果没有影响,因为后面的max-pooling只会输出最大值,补零的项会被过滤掉.

?num_classes 多分类, 分为几类. ?vocabulary_size 语料库的词典大小, 记为|D|. ?embedding_size 将词向量的维度, 由原始的|D| 降维到embedding_size. ?filter_size_arr 多个不同size的filter. 3.Embedding Layer 通过一个隐藏层, 将one-hot 编码的词投影到一个低维空间中. 本质上是特征提取器,在指定维度中编码语义特征. 这样, 语义相近的词, 它们的欧氏距离或余弦距离也比较近. 4.Convolution Layer 为不同尺寸的filter 都建立一个卷积层. 所以会有多个feature map. 图像是像素点组成的二维数据, 有时还会有RGB三个通道, 所以它们的卷积核至少是二维的. 从某种程度上讲, word is to text as pixel is to image, 所以这个卷积核的size 与stride 会有些不一样. ?x i x i∈R k, 一个长度为n的句子中, 第i 个词语的词向量, 维度为k. ?x i:j x i:j=x i⊕x i+1⊕...⊕x j 表示在长度为n的句子中, 第[i,j] 个词语的词向量的拼接.

文本分类的常见方法

文本分类的常见方法

文本分类的过程: (1)选择训练文本。好的训练文本对分类器的最终结果起到至关重要的作用。 (2)选择文本特征。对训练样本和测试样本进行数据预处理,包括分词、去停用词、消除噪音等。目前的文本分类研究,主要选取一些具有代表性的词、词组、短语来表示文本。(3)建立文本表示模型。为了便于计算机理解和计算相关的文本属性,需要对文本进行表示,其中向量空间模型(Vector Space Model VSM)运用最为广泛。 (4)选择分类方法。文本分类的核心部分,不同的分类方法原理不同需要处理的数 据也不同。经典分类算法有朴素贝叶斯(Naive Bayes NB)、K-近邻(K-Nearest Neighbor KNN)、决策树(Decision Tree DTree)、算数平均质心(Arithmetical Average Centroid AAC)、支持向量机(Support Vector Machine SVM)。 (5)分类结果的评估。目前主流的评估标准准确率、召回率和F1值。

选择文本特征 我们需要将文档转换为计算机可以衡量、运算的形式。现在运用最广泛的形式:将文档映射入向量空间。具体流程如图1。 张三说的确实在理。李四买了一张三角桌子。 张三/说/的/确实/在理。 李四/买/了/一张/三角/桌子。 对中文文档进行分词 中文分词系统:盘古、Lucene 张三、在理 李四、三角、桌子 去除停顿词 在理、三角、桌子 特征项提取 评判的标准:信息增益、期望交叉熵 互信息、开放检验 这样就将一篇文章映射成了为了向量空间中的一个向量。在把文章都映射完成后,我们可以根据自己不同的需求,在向量空间中进行运算。比如计算两篇文章的相似度:我们把向量的起点都映射到原点,则我们可以比较向量的长度、向量的夹角、向量两个终点的距离等等;我们还可以宏观的观察大量的向量在向量空间中的分布情况,对大量聚集在一起的向量抽取它们的共性:计算他们的中心、他们整体的方向等。其实数学模型很好,只不过限于计算机的存储、运算水平,向量空间的维度过高、文档数量过大、计算复杂度过高会使得模型的计算机实现变得困

数据挖掘文本分类实验报告

北京邮电大学 ****学年第1学期实验报告 课程名称:数据仓库与数据挖掘 实验名称:文本的分类 实验完成人: 姓名:*** 学号:*&*** 姓名:** 学号:**

日期:

实验一:文本的分类 1.实验目的 ◆掌握数据预处理的方法,对训练集数据进行预处理; ◆掌握文本分类建模的方法,对语料库的文档进行建模; ◆掌握分类算法的原理,基于有监督的机器学习方法,训 练文本分类器; ◆了解SVM机器学习方法,可以运用开源工具完成文本分 类过程。 2.实验分工 ***: (1)对经过分词的文本进行特征提取并用lisvm进行训练 (2)用训练的模型对测试数据进行预测 ***: (1)数据采集和预处理 (2)分词 3.实验环境 Ubuntu 13.04+jdk1.7

4.主要设计思想 4.1 实验工具介绍 1.NLPIR_ICTCLAS2013 NLPIR (又名ICTCLAS2013),是由中科院张华平博士倾力打造的汉语分词系统。其主要功能包括中文分词、词性标注、命名实体识别、用户词典功能、支持GBK编码、UTF8编码、BIG5编码等。 从NLPIR官网可以下载其最新版的Java发布包,然后导入Eclipse,配置运行环境,实现对于语料库的分词。 最新的NLPIR可以通过更改源代码实现新增新词识别、关键词提取、微博分词等功能,极大地方便了使用。 2. Eclipse for Java Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。 3. LibSVM 本次实验中我们采用的是台湾大学林智仁博士等开发设计的LIBSVM方法。这是一个操作简单、易于使用、快速有效的通用SVM 软件包,可以解决分类问题(包括C?SVC 、ν?SVC ),回归问题(包括ε ? SVR 、v? SVR ) 以及分布估计(one ?

相关文档