文档库 最新最全的文档下载
当前位置:文档库 › 人工智能YOLO V2 图像识别实验报告

人工智能YOLO V2 图像识别实验报告

人工智能YOLO V2 图像识别实验报告
人工智能YOLO V2 图像识别实验报告

第一章前言部分

1.1课程项目背景与意义

1.1.1课程项目背景

视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

科学技术的发展是推动人类社会进步的主要原因之一,未来社会进一步地朝着科技化、信息化、智能化的方向前进。在信息大爆炸的今天,充分利用这些信息将有助于社会的现代化建设,这其中图像信息是目前人们生活中最常见的信息。利用这些图像信息的一种重要方法就是图像目标定位识别技术。不管是视频监控领域还是虚拟现实技术等都对图像的识别有着极大的需求。一般的图像目标定位识别系统包括图像分割、目标关键特征提取、目标类别分类三个步骤。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。

深度学习是机器学习中的一个新的研究领域,通过深度学习的方法构建深度网络来抽取特征是目前目标和行为识别中得到关注的研究方向,引起更多计算机视觉领域研究者对深度学习进行探索和讨论,并推动了目标和行为识别的研究,推动了深度学习及其在目标和行为识别中的新进展。基于这个发展趋势,我们小组选择了基于回归方法的深度学习目标识别算法YOLO的研究。

1.1.2课程项目研究的意义

众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃

发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。

深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。

目标检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现在图像中哪个区域。图像中的目标可能出现在任何位置,目标的形态可能存在各种各样的变化,图像的背景千差万别……,这些因素导致目标检测并不是一个容易解决的任务。

这次课程项目,正是基于视觉、深度学习、目标识别而进行的,是一个热度很高的话题。基于深度学习的目标识别研究具有重大的意义,深度学习的目标识别算法对于未来能够使用目标检测和图像识别的手段运用于物联网、智能设备、生物制药经济调控等多领域有很大的作用。

1.2国内外研究现状

机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。机器能否像人类一样能具有学习能力呢?1959年美国的塞缪尔(Samuel)设计了一个下棋程序,这个程序具有学习能力,它可以在不断的对弈中改善自己的棋艺。4年后,这个程序战胜了设计者本人。又过了3年,这个程序战胜了美国一个保持8年之久的常胜不败的冠军。这个程序向人们展示了机器学习的能力,提出了许多令人深思的社会问题与哲学问题。深度学习最近几年发展速度十分快,因此同时也推动了目标识别技术的发展,技术的革新总是相互影响的。

目标检测是图像处理和计算机视觉的一个重要分支,在理论和实践上都有重大意义。近年来,随着物联网的高速发展与智能终端的广泛普及,目标检测技术成了机器视觉领域的研究热点,被国内外学者广泛关注。

目标检测的研究主要包括了基于视频图像的目标检测和基于静态图片的目标检测。本文主要讨论基于静态图片的目标检测算法,即在静态图片中检测并定位所设定种类的目标。基于静态图片的目标检测的难点主要在于图片中的目标会因光照、视角以及目标内部等变化而产生变化。针对以上的难点,国内外学者进行了很多尝试。目前提出的方法主要分为基于形状轮廓的目标检测算法和基于目标特征的检测方法。

计算机视觉是指用计算机实现人的视觉功能,它的研究目标就是使计算机具有用过一幅或多幅图像认知周围环境的能力(包括对客观世界三维环境的感知、

识别与理解)。运动目标检测作为计算机视觉技术的一个分支,就是对视场内的运动目标,如人或交通工具,进行实时的观测,并将其分类,然后分析他们的行为。目前,国际上许多高校和研究所,如麻省理工学学院、牛津大学等都专门设立了针对运动目标检测的研究组或者研究实验室。美英等国家已经研究了大量的相关项目。一些著名公司和研究机构,如IBM、Microsoft、麻省理工学院等近几年来投入了大量的人力物力来进行智能监控系统的研究,部分成果已经转化为产品投入了市场。

目前在国内的研究机构中,中国科学院北京自动化研究所下属的模式识别国家重点实验室视觉监控研究处于领先地位。他们在交通场景视觉监控、人的运动视觉监控和行为模式识别方面进行了深入研究。另外他们也总结了英国雷丁大学VIEWS的车辆交通监控原型系统的研究经验,在之前的理论研究的基础上,自行设计并初步实现了一个拥有完全自主知识产权的交通监控原型系统vstart(Visual surveillance star)。国内其他高校如上海交通大学、北京航空航天大学也对这方面进行了研究。

尽管这样,目前在运动目标检测和视觉监控这方面仍然存在着许多不足:目前国内市场上所见到的大部分智能监控产品来源于国外,性能和可靠性不够,并且维护和安装问题需要外方全方位参加,给国家安全带来了巨大的隐患。目标之间互遮挡和人体自遮挡问题,尤其是在拥挤状态下,多人的检测更是难处理。

1.3本论文结构

本文是基于回归方法的深度学习目标识别算法YOLO的研究。

第一章:前言。主要介绍课程项目背景与意义、国内外研究的现状,以及本论文的结构。

第二章:使用工具介绍及安装。包括CentOS系统、OpenCV工具、CUDA开发环境、环境的搭建。

第三章:YOLO算法简介。包括YOLO方法特点、核心思想和实现方法、以及YOLO 的创新。

第四章:训练数据采集与制作。包括训练数据的采集、训练数据的制作。

第五章:训练配置、训练及测试训练效果。包括具体的训练配置、训练过程和测试训练效果。

第六章:总结。包含对本次课程项目实践过程的感想与收获,以及对未来的展望。

第二章使用工具介绍及安装

2.1 CentOS系统

CentOS(Community ENTerprise Operating System)是Linux发行版之一,它是来自于Red Hat Enterprise Linux依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定性的服务器以CentOS 替代商业版的Red Hat Enterprise Linux使用。两者的不同,在于CentOS并不包含封闭源代码软件。

CentOS,我们有很多人叫它社区企业操作系统,不管怎么叫它,它都是linux 的一个发行版本。CentOS并不是全新的linux发行版,在RedHat家族中有企业版的产品,它是Red Hat Enterprise Linux,CentOS是RHEL的克隆版本,RHEL 是很多企业采用的linux发行版本,需要向RedHat付费才可以使用,并能得到付过费用的服务和技术支持和版本升级。这个CentOS可以像REHL一样的构筑linux系统环境,但不需要向RedHat付任何的费用,同样也得不到任何有偿技术支持和升级服务。

CentOS有很多特点:CentOS就是对Red Hat AS进行改进后发布的,各种操作、使用和RED HAT没有区别;CentOS完全免费,不存在RED HAT AS4需要序列号的问题;CentOS独有的yum命令支持在线升级,可以即时更新系统,不像RED HAT那样需要花钱购买支持服务;CentOS修正了许多RED HAT AS的BUG。

基于开源的特性,Linux环境被很多技术人员和公司使用。Linux以它的高效性和灵活性著称,Linux模块化的设计结构,使得它既能在价格昂贵的工作站上运行,也能够在廉价的PC机上实现全部的Unix特性,具有多任务、多用户的能力。我们这次的课程项目“基于深度学习的目标识别研究”也是在Linux环境下完成的,因此本次项目实现使用的是CentOS 7.0系统。

2.2 OpenCV工具

OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS 操作系统上。它轻量级而且高效,由一系列 C 函数和少量 C++ 类构成,同时提

供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

OpenCV致力于真实世界的实时应用,通过优化的C代码的编写对其执行速度带来了可观的提升,并且可以通过购买Intel的IPP高性能多媒体函数库得到更快的处理速度。

OpenCV是一个用于图像处理、分析、机器视觉方面的开源函数库。无论是做科学研究,还是商业应用,OpenCV都是一个理想的工具库。因为,对于这两者,它完全是免费的。该库采用C及C++语言编写,该库的所有代码都经过优化,计算效率很高,因为,它更专注于设计成为一种用于实时系统的开源库。OpenCV 采用C语言进行优化,而且,在多核机器上面,其运行速度会更快。它的一个目标是提供友好的机器视觉接口函数,从而使得复杂的机器视觉产品可以加速面世。该库包含了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉等领域的超过500个接口函数。同时,由于计算机视觉与机器学习密不可分,该库也包含了比较常用的一些机器学习算法。图像识别、机器视觉在安防领域有所应用。并且在航拍图片、街道图片中,也要依赖于机器视觉的摄像头标定、图像融合等技术。近年来,在入侵检测、特定目标跟踪、目标检测、人脸检测、人脸识别、人脸跟踪等领域,OpenCV的应用及其广泛,而这些,仅仅是其应用的冰山一角。

一个典型的计算机视觉算法,应该包含以下一些步骤:

(1)数据获取(对OpenCV来说,就是图片);

(2)预处理;

(3)特征提取;

(4)特征选择;

(5)分类器设计与训练;

(6)分类判别;

而OpenCV工具对这六个部分,分别提供了API。

2.3 CUDA开发环境

随着显卡的发展,GPU越来越强大,而且GPU为显示图像做了优化。在计算

上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA运算平台,CUDA即Compute Unified Device Architecture,是NVidia利用GPU平台进行通用并行计算的一种架构,该架构使GPU能够解决复杂的计算问题,它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以利用C语言、OpenCL、Fortran、c++等为CUDA架构编写程序。(1)CUDA体系架构

CUDA体系架构由两部分组成,分别是流处理器阵列(SPA)和存储器系统。

流处理阵列(SPA)的结构又分为两层:TPC(线程处理器群)和SM(流多处理器)。GPU的巨大计算能力来自于SPA中的大量计算单元。

存储器系统由几个部分组成:存储器控制器(MMC)、固定功能的光栅操作单元(ROP)以及二级纹理操作。

(2)CUDA执行模型

将CPU作为主机(Host),而GPU作为协处理器(Coprocessor)或者设备(Device),从而让GPU来运行一些能够被高度线程化的程序。

在这个模型中,CPU与GPU协同工作,CPU负责进行逻辑性强的事务处理和串行计算,GPU则专注于执行高度线程化的并行处理任务。

一个完整的CUDA程序是由一系列的设备端kernel函数并行步骤和主机端的串行处理步骤共同组成的。

CUDA执行模型如下图:

Grid(网格)运行在SPA上;

Block(线程块)运行在SM上;

Thread(线程)运行在SP上。

Kernel不是一个完整的程序,而只是其中的一个关键并行计算步骤。Kernel以一个网格(Grid)的形式执行,每个网格由若干个线程块(block)组成,每一个线程块又由若干个线程(thread)组成。

在 CUDA 的架构下,一个程序分为两个部份:Host 端和 Device 端。Host 端是指在 CPU 上执行的部份,而 Device 端则是在显示芯片(GPU)上执行的部份。Device 端的程序又称为 "kernel"。通常 Host 端程序会将数据准备好后,复制到显卡的内存中,再由显示芯片执行 Device 端程序,完成后再由 Host 端程序将结果从显卡的内存中取回。由于 CPU 存取显卡内存时只能透过 PCI Express 接口,因此速度较慢,因此不能经常进行这类动作,以免降低效率。

由于显示芯片大量并行计算的特性,它处理一些问题的方式和一般 CPU 是不同的。主要的特点包括:

(1)内存存取 latency (等待时间)的问题:CPU 通常使用 cache 来减少存取主内存的次数,以避免内存 latency 影响到执行效率。显示芯片则多半没有

cache(或很小),而利用并行化执行的方式来隐藏内存的 latency(即当第一个 thread 需要等待内存读取结果时,则开始执行第二个thread,依此类推)。(2)分支指令的问题:CPU 通常利用分支预测等方式来减少分支指令造成的流水线。显示芯片则多半使用类似处理内存 latency 的方式。不过,通常显示芯片处理分支的效率会比较差。

因此,最适合利用 CUDA 处理的问题,是可以大量并行化的问题,才能有效隐藏内存的 latency,并有效利用显示芯片上的大量执行单元。使用 CUDA 时,同时有上千个 thread 在执行是很正常的。因此,如果不能大量并行化的问题,使用 CUDA 就没办法达到最好的效率了。在这个过程中,CPU担任的工作为控制GPU执行,调度分配任务,并能做一些简单的计算,而大量需要并行计算的工作都交给GPU 实现。另外需要注意的是,由于 CPU 存取显存时只能通过PCI-Express 接口,速度较慢,因此不能经常进行,以免降低效率。通常可以在程序开始时将数据复制进GPU显存,然后在 GPU内进行计算,直到获得需要的数据,再将其复制到系统内存中。

2.4 环境的搭建

一、项目源代码下载与安装

1.使用git把项目源代码下载到本地

git clone https://https://www.wendangku.net/doc/309359552.html,/pjreddie/darknet

2.进入项目目录,编译

cd darknet

make

二、项目目录结构

编译完成后,项目主要文件如下:

darknet 项目目录

├─cfg 配置文件存放目录

├─data 数据存放目录

├─examples C语言测试用例

├─include darknet头文件

├─python Python测试用例

├─scripts 训练中用到的辅助脚本

├─src 项目源代码

├─darknet 编译后产生的darknet可执行文件

│├─config.php 模块配置文件

│├─common.php 模块函数文件

三、测试对象识别

1.下载官方提供的训练好的权重数据

wget https://https://www.wendangku.net/doc/309359552.html,/media/files/yolo.weights

2.测试识别对象:

./darknet detect cfg/yolo.cfg yolo.weights data/dog.jpg

在上述命令中,detect表示调用darknet的对象识别功能,cfg/yolo.cfg是配置文件,包含各层网络的参数、要识别的物体种类数等,yolo.weights是上一步下载的权重数据,data/dog.jpg是要进行对象识别的照片,照片内容如下图:

执行命令:

上图显示检测过程在0.35秒内完成,这是安装完显卡驱动后运行的结果,在安装显卡驱动前,使用CPU进行图像检测,花费时间大约为8秒。命令执行完成后,将会把识别结果生成到predictions.jpg,打开图片如下图所示:

四、训练环境安装

1.使用YUM安装OpenCV

sudo yum install opencv

2.安装显卡驱动及其开发工具包CUDA,安装CUDA必须要有一个Nvidia的显卡,本机的显卡是GTX 860M。CUDA下载网址为:

https://https://www.wendangku.net/doc/309359552.html,/cuda-downloads

官方还提供了CUDA安装过程所需的pdf文档,仔细阅读并按照其步骤安装即可。此次安装使用runfile安装。首先检测本机是否有Nvidia显卡,执行以下命令: lspci | grep -i nvidia

有任何输出说明本机有Nvidia显卡,本机输出结果如下:

01:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 860M] (rev a2)

接下来查看系统内核版本:

uname -m && cat /etc/*release

该命令会显示系统架构以及内核版本信息,本机主要的输出信息如下:

x86_64

CentOS Linux release 7.3.1611 (Core)

确认编译器gcc已经安装,该命令会打印gcc的版本,如果提示找不到命令则说明没有安装gcc:

gcc --version

安装Kernel-header和kernel-devel,这两个包的版本需要和本机的内核版本一致,安装命令如下:

sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

开始安装cuda,本次实验使用的是runfile安装。Nouveau是一个开源的3D驱动,安装Nvidia驱动之前需要先将其关闭。首先要把Nouveau加入黑名单,创建/etc/modprobe.d/blacklist-nouveau.conf 文件并写入以下内容:

blacklist nouveau

options nouveau modeset=0

重新生成内核initramfs:

sudo dracut --force

重新启动计算机,在进入登录界面时,不要登录,按下ALT+F2进入命令提示符模式,使用root用户登录,然后使用init 3 命令进入多用户模式开始安装Naidia驱动。执行以下命令开始安装CUDA:

./cuda_8.0.61_375.26_linux-run

安装过程会提示是否安装CUDA工具箱、CUDA例子等,此次试验中选择安装。

最后将cuda加入到环境变量中、重启,即完成安装。将cude加入到环境变量:export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\

${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

3.安装完成OpenCV和CUDA后,需要修改YOLO的Makefile文件并重新编译。打开Makefile文件,将OPENCV=0改为OPENCV=1,将GPU=0改为GPU=1,并执行make命令重新编译。

第三章YOLO算法原理

3.1 YOLO算法简介

基于深度学习方法的一个特点就是实现端到端的检测。相对于其它目标检测与识别方法(比如Fast R-CNN)将目标识别任务分类目标区域预测和类别预测等多个流程,YOLO将目标区域预测和目标类别预测整合于单个神经网络模型中,实现在准确率较高的情况下快速目标检测与识别,更加适合现场应用环境。

YOLO为一种新的目标检测方法,该方法的特点是实现快速检测的同时还达到较高的准确率。作者将目标检测任务看作目标区域预测和类别预测的回归问题。该方法采用单个神经网络直接预测物品边界和类别概率,实现端到端的物品检测。同时,该方法检测速非常快,基础版可以达到45帧/s的实时检测;FastYOLO 可以达到155帧/s。与当前最好系统相比,YOLO目标区域定位误差更大,但是背景预测的假阳性优于当前最好的方法。

人类视觉系统快速且精准,只需看一眼即可识别图像中物品及其位置。

传统目标检测系统采用deformable parts models (DPM)方法,通过滑动框方法提出目标区域,然后采用分类器来实现识别。近期的R-CNN类方法采用region proposal methods,首先生成潜在的bounding boxes,然后采用分类器识别这些bounding boxes区域。最后通过post-processing来去除重复bounding

boxes来进行优化。这类方法流程复杂,存在速度慢和训练困难的问题。

而YOLO方法将目标检测问题转换为直接从图像中提取bounding boxes和类别概率的单个回归问题,只需一眼即可检测目标类别和位置。

3.2 YOLO方法特点

YOLO采用单个卷积神经网络来预测多个bounding boxes和类别概率,如图所示:

本方法相对于传统方法有如下优点:

(1)速度非常快。YOLO预测流程简单,速度很快。基础版在Titan X GPU 上可以达到45帧/s;快速版可以达到150帧/s。因此,YOLO可以实现实时检测。

(2)YOLO采用全图信息来进行预测。与滑动窗口方法和region proposal-based方法不同,YOLO在训练和预测过程中可以利用全图信息。Fast R-CNN检测方法会错误的将背景中的斑块检测为目标,原因在于Fast R-CNN在检测中无法看到全局图像。相对于Fast R-CNN,YOLO背景预测错误率低一半。

(3)YOLO可以学习到目标的概括信息,具有一定普适性。采用自然图片训练YOLO,采用艺术图像来预测。YOLO比其它目标检测方法(DPM和R-CNN)准确率高很多。

本方法有如下缺点:

(1)YOLO对相互靠的很近的物体,还有很小的群体检测效果不好,这是因为一个网格中只预测了两个框,并且只属于一类。

(2)对测试图像中,同一类物体出现的新的不常见的长宽比和其他情况是。泛化能力偏弱。

(3)由于损失函数的问题,定位误差是影响检测效果的主要原因。尤其是

大小物体的处理上,还有待加强。

3.3 YOLO 的核心思想和实现方法

1.YOLO 的核心思想

YOLO 的核心思想就是利用整张图作为网络的输入,直接在输出层回归bounding box 的位置和bounding box 所属的类别。

2.YOLO 的实现方法

YOLO 的实现过程图解和方法如下:

(1)将一幅图像分成SxS 个网格(grid cell),如果某个目标的中心落在这个网格中,则这个网格就负责预测这个目标。

(2)每个网格要预测B 个bounding box ,每个bounding box 除了要回归自身的位置之外,还要附带预测一个confidence 值,这个confidence 代表了所预测的box 中含有目标的置信度和这个box 预测的有多准两重信息,其值是这样计算

的: truth (r pred

IOU P 目标)(其中如果有目标落在一个grid cell 里,第一项取1,否则取0。 第二项是预测的bounding box 和实际的groundtruth 之间的IOU 值)。

(3)每个bounding box 要预测(x, y, w, h)和confidence 共5个值,每个网格还要预测一个类别信息,记为C 类。则SxS 个网格,每个网格要预测B 个bounding box ,还要预测C 个categories 。输出就是S x S x (5*B+C)的一个tensor 。(注意:class 信息是针对每个网格的,confidence 信息是针对每个bounding box 的)。

举例说明: 在PASCAL VOC 中,图像输入为448x448,取S=7,B=2,一共有

20个类别(C=20)。则输出就是7x7x30的一个tensor 。

整个网络结构如下图所示:

(4)在测试的时候,每个网格预测的class 信息和bounding box 预测的confidence 信息相乘,就得到每个bounding box 的class-specific confidence score:

truth pred i truth pred IOU class IOU object object class P *=**)Pr()Pr()|(r

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box 预测的confidence 。这个乘积即encode 了预测的box 属于某一类的概率,也有该box 准确度的信息。

(5)得到每个box 的class-specific confidence score 以后,设置阈值,滤掉得分低的boxes ,对保留的boxes 进行NMS 处理,就得到最终的检测结果。

3.4 YOLO 的实现细节

1.预训练:

使用imageNet 预训练,网络结构是前20层网络加上一个平均池化层和一个全连接层。

2.预测:

由于预测需要更加精细的像素,所以把输入扩展成448*448,并且增加了四个卷积层和两个全连接层。在最后一层预测中,需要预测概率和bounding box ,这里把bounding box 的预测归一化成0到1。

3.激活函数:

最后一层的激活函数使用线性激活函数,而其他层使用leaky ReLU的激活函数:

4.误差传播:

误差的计算采用简单的平方和误差函数。但是,从网络结构可以知道,预测概率的维数比预测bounding box的维数要高,而且,在图片中大多的格子是没有物体的,这会使得它们的confidence趋于0。它们的贡献过大,会使得网络无法收敛。

我们采用的一个办法就是加权,赋予不同的权值,对于预测bounding box 的,而对于没有目标物体的格子的误差赋予权值。同时,对于大的box的小误差肯定要比小box的小误差影响更小,于是,采用对w,h,x,y取平方根的做法,因为平方根函数的图像随着x的增大会变得平缓。

此外,一个网格可能会预测多个box,希望每个box负责专门的目标物体的预测。方法是,对于一个物体的truth box,看哪个bounding box的IOU更大,就让它负责这个box。公式为:

其中对应格子i如果有物体,那相应的bounding box j负责这个物体

的预测。表示格子i中是否有物体。

5.训练方法:

使用随机梯度下降法,以及dropout的方法。

3.4 YOLO的创新

YOLO将物体检测作为回归问题求解。基于一个单独的端到端网络,完成从

原始图像的输入到物体位置和类别的输出。从网络设计上,YOLO与RCNN、Fast

RCNN及Faster RCNN的区别如下:

(1)YOLO训练和检测均是在一个单独网络中进行。YOLO没有显示地求取

region proposal的过程。而RCNN/Fast RCNN采用分离的模块(独立于网络之

外的selective search方法)求取候选框(可能会包含物体的矩形区域),训

练过程因此也是分成多个模块进行。Faster RCNN使用RPN(region proposal

network)卷积网络替代RCNN/Fast RNN的selective search模块,将RPN集成

到Fast RCNN检测网络中,得到一个统一的检测网络。尽管RPN与Fast RCNN

共享卷积层,但是在模型训练过程中,需要反复训练RPN网络和Fast RCNN网络。

(2)YOLO将物体检测作为一个回归问题进行求解,输入图像经过一次

inference,便能得到图像中所有物体的位置和其所属类别及相应的置信概率。

而RCNN/Fast RCNN/Faster RCNNA将检测结果分为两部分求解:物体类别(分类

问题),物体位置即bounding box(回归问题)。

第四章训练数据采集与制作

4.1训练数据的采集

准备需要训练的图片:

本次实验训练的是水果的识别,种类一共5种,分别是WaterMelon、StrawBerry、Orange、Pineapple、Apple,每种水果图片约30-40张,总共有171张图片。图片全部从百度图片中下载,图片分辨率一般在400*300像素左右。将图片按照按照5位数字从00000递增开始命名,并将其全部放到一个文件夹中。

4.2 训练数据的制作

1.下载并编译安装LabelImg,使用这个软件给171张水果图片标记对象位置和名称。

2.标记完成后,LabelImg将会生成一个记录了对象名称和位置的xml文件,每张图片对应一个xml文件,xml文件内容如下。

人工智能实验报告大全

人工智能实验报告大 全

人工智能课内实验报告 (8次) 学院:自动化学院 班级:智能1501 姓名:刘少鹏(34) 学号: 06153034 目录 课内实验1:猴子摘香蕉问题的VC编程实现 (1) 课内实验2:编程实现简单动物识别系统的知识表示 (5)

课内实验3:盲目搜索求解8数码问题 (18) 课内实验4:回溯算法求解四皇后问题 (33) 课内实验5:编程实现一字棋游戏 (37) 课内实验6:字句集消解实验 (46) 课内实验7:简单动物识别系统的产生式推理 (66) 课内实验8:编程实现D-S证据推理算法 (78)

人工智能课内实验报告实验1:猴子摘香蕉问题的VC编程实现 学院:自动化学院 班级:智能1501 姓名:刘少鹏(33) 学号: 06153034 日期: 2017-3-8 10:15-12:00

实验1:猴子摘香蕉问题的VC编程实现 一、实验目的 (1)熟悉谓词逻辑表示法; (2)掌握人工智能谓词逻辑中的经典例子——猴子摘香蕉问题的编程实现。 二、编程环境 VC语言 三、问题描述 房子里有一只猴子(即机器人),位于a处。在c处上方的天花板上有一串香蕉,猴子想吃,但摘不到。房间的b处还有一个箱子,如果猴子站到箱子上,就可以摸着天花板。如图1所示,对于上述问题,可以通过谓词逻辑表示法来描述知识。要求通过VC语言编程实现猴子摘香蕉问题的求解过程。 图1 猴子摘香蕉问题

四、源代码 #include unsigned int i; void Monkey_Go_Box(unsigned char x, unsigned char y) { printf("Step %d:monkey从%c走到%c\n", ++i, x, y);//x表示猴子的位置,y为箱子的位置 } void Monkey_Move_Box(char x, char y) { printf("Step %d:monkey把箱子从%c运到%c\n", ++i, x, y);//x表示箱子的位置,y为香蕉的位置 } void Monkey_On_Box() { printf("Step %d:monkey爬上箱子\n", ++i); } void Monkey_Get_Banana() { printf("Step %d:monkey摘到香蕉\n", ++i); } void main() { unsigned char Monkey, Box, Banana; printf("********智能1501班**********\n"); printf("********06153034************\n"); printf("********刘少鹏**************\n"); printf("请用a b c来表示猴子箱子香蕉的位置\n"); printf("Monkey\tbox\tbanana\n"); scanf("%c", &Monkey); getchar(); printf("\t"); scanf("%c", &Box); getchar(); printf("\t\t"); scanf("%c", &Banana); getchar(); printf("\n操作步骤如下\n"); if (Monkey != Box) { Monkey_Go_Box(Monkey, Box); } if (Box != Banana)

游戏人工智能实验报告记录四

游戏人工智能实验报告记录四

————————————————————————————————作者:————————————————————————————————日期:

实验四有限状态机实验 实验报告 一、实验目的 通过蚂蚁世界实验掌握游戏中追有限状态机算法 二、实验仪器 Windows7系统 Microsoft Visual Studio2015 三、实验原理及过程 1)制作菜单 设置参数:点击会弹出对话框,设置一些参数,红、黑蚂蚁的家会在地图上标记出来 运行:设置好参数后点击运行,毒药、食物、水会在地图上随机显示 下一步:2只红蚂蚁和2只黑蚂蚁会随机出现在地图上,窗口右方还会出现红、黑蚂蚁当前数量的统计 不断按下一步,有限状态机就会不断运行,使蚁群产生变化 2)添加加速键

资源视图中下方 选择ID和键值

3)新建头文件def.h 在AntView.cpp中加入#include"def.h" 与本实验有关的数据大都是在这里定义的 int flag=0; #define kForage 1 #define kGoHome 2 #define kThirsty 3 #define kDead 4 #define kMaxEntities 200 class ai_Entity{ public: int type; int state; int row; int col; ai_Entity(); ~ai_Entity() {} void New (int theType,int theState,int theRow,int theCol); void Forage(); void GoHome(); void Thirsty(); void Dead();

《人工智能导论》试卷B

人工智能试卷(B) 试题部分: 一、选择题(15小题,共15分) 1、97年5月,著名的“人机大战”,最终计算机以3.5比2.5的总比分将世界国际象棋棋王卡斯帕罗夫击败,这台计算机被称为(A) A)深蓝B)IBM C)深思D)蓝天 2、下列不在人工智能系统的知识包含的4个要素中D A)事实B)规则C)控制和元知识D)关系 3、谓词逻辑下,子句, C1=L∨C1‘, C2= ? L∨C2‘, 若σ是互补文字的(最一般)合一置换,则其归结式C=(A ) A) C1’σ∨C2’σB)C1’∨C2’C)C1’σ∧C2’σD)C1’∧C2’ 4、或图通常称为D A)框架网络B)语义图C)博亦图D)状态图 5、不属于人工智能的学派是B A)符号主义B)机会主义C)行为主义D)连接主义。 6、人工智能的含义最早由一位科学家于1950年提出,并且同时提出一个机器智能的测试模型,请问这个科学家是C A)明斯基B).扎德C)图林D)冯.诺依曼 7、要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫(B )。 A)专家系统B)机器学习C)神经网络D)模式识别 8、下列哪部分不是专家系统的组成部分(A) A.)用户B)综合数据库C)推理机D)知识库 9、产生式系统的推理不包括(D ) A)正向推理B)逆向推理C)双向推理D)简单推理 10、C(B|A) 表示在规则A->B中,证据A为真的作用下结论B为真的B A)可信度B)信度C)信任增长度D)概率 11、AI的英文缩写是B A)Automatic Intelligence B)Artifical Intelligence C)Automatice Information D)Artifical Information 12、反演归结(消解)证明定理时,若当前归结式是(C)时,则定理得证。 A)永真式B)包孕式(subsumed)C)空子句 13、在公式中?y?xp(x,y)),存在量词是在全称量词的辖域内,我们允许所存在的x可能依赖于y值。令这种依赖关系明显地由函数所定义,它把每个y值映射到存在的那个x。这种函数叫做(B ) A. 依赖函数 B. Skolem函数 C. 决定函数 D. 多元函数 14、子句~P∨Q和P经过消解以后,得到(B ) A. P B. Q C. ~P D.P∨Q

人工智能实验报告

《人工智能》课外实践报告 项目名称:剪枝法五子棋 所在班级: 2013级软件工程一班 小组成员:李晓宁、白明辉、刘小晶、袁成飞、程小兰、李喜林 指导教师:薛笑荣 起止时间: 2016-5-10——2016-6-18

项目基本信息 一、系统分析 1.1背景

1.1.1 设计背景 智力小游戏作为人们日常休闲娱乐的工具已经深入人们的生活,五子棋更成为了智力游戏的经典,它是基于AI的αβ剪枝法和极小极大值算法实现的人工智能游戏,让人们能和计算机进行对弈。能使人们在与电脑进行对弈的过程中学习五子棋,陶冶情操。并且推进人们对AI的关注和兴趣。 1.1.2可行性分析 通过研究,本游戏的可行性有以下三方面作保障 (1)技术可行性 本游戏采用Windows xp等等系统作为操作平台,使用人工智能进行算法设计,利用剪枝法进行编写,大大减少了内存容量,而且不用使用数据库,便可操作,方便可行,因此在技术上是可行的。 (2)经济可行性 开发软件:SublimText (3)操作可行性 该游戏运行所需配置低、用户操作界面友好,具有较强的操作可行性。 1.2数据需求 五子棋需要设计如下的数据字段和数据表: 1.2.1 估值函数:

估值函数通常是为了评价棋型的状态,根据实现定义的一个棋局估值表,对双方的棋局形态进行计算,根据得到的估值来判断应该采用的走法。棋局估值表是根据当前的棋局形势,定义一个分值来反映其优势程度,来对整个棋局形势进行评价。本程序采用的估值如下: 状态眠二假活三眠三活二冲四假活三活三活四连五 分值 2 4 5 8 12 15 40 90 200 一般来说,我们采用的是15×15的棋盘,棋盘的每一条线称为一路,包括行、列和斜线,4个方向,其中行列有30路,两条对角线共有58路,整个棋盘的路数为88路。考虑到五子棋必须要五子相连才可以获胜,这样对于斜线,可以减少8路,即有效的棋盘路数为72路。对于每一路来说,第i路的估分为E(i)=Ec(i)-Ep(i),其中Ec(i)为计算机的i路估分,Ep(i)为玩家的i路估分。棋局整个形势的估值情况通过对各路估分的累加进行判断,即估值函数: 72 F(n)= Σ E(i) i=1 1.2.2 极小极大值算法: 极大极小搜索算法就是在博弈树在寻找最优解的一个过程,这主要是一个对各个子结点进行比较取舍的过程,定义一个估值函数F(n)来分别计算各个终结点的分值,通过双方的分值来对棋局形势进行分析判断。以甲乙两人下棋为例,甲为max,乙为min。当甲走棋时,自然在博弈树中寻找最大点的走法,轮到乙时,则寻找最小点的走法,如此反复,这就是一个极大极小搜索过程,以此来寻找对机器的最佳走法。

人工智能导论试卷一答案 (上海交大)

一、选择题答案1、b 2、A 3、A 二、填空题答案 1、在修正的A算法中,fm的含义是到当前为止,扩展的节点中,f的最大值 2、对任意节点n,设m是n的子节点,当h满足条件h(n)-h(m) ≤ C(n, m), h(t) = 0时,称h是单调的。 三、问答题答案 第1题 答:当问题有解时,A*算法总是找到问题的最优解结束。如果h函数定义的不合理,则当扩展一个节点时,不一定就找到了从初始节点到该节点的最优路径,对于这样的节点,就有可能被多次扩展。特别是如果这样的节点处于问题的最优解路径上时,则一定会被多次扩展。解决的方法一是对h函数的定义给出限制,使得h满足单调性。对于满足单调性条件的h,则一定不会出现重复扩展节点问题。二是对A*算法加以改进,使用修正的A*算法进行搜索,则可以减少重复扩展节点问题。 第2题 答:回溯搜索策略与深度有限搜索策略最大的不同是深度有限搜索策略属于图搜索,而回溯搜索则不是图搜索。在回溯搜索中,只保留了从初始节点到当前节点的搜索路径。而深度优先搜索,则保留了所有的已经搜索过的路径。 第3题 答:化子句集如下:

归结树如下: 修改证明树:

得到问题的解答:R(h(f(g(c, a)))) 第4题 第5题 答:搜索图如图所示,其中括号内标出的是节点的f值,圆圈内的数字是扩展的次序。F(16) 得到的解路径为:S-B-F-J-T 第6题 答:如下的知识可以帮助求解该问题: (1)序列中,偶数在偶数位置,奇数在奇数位置; (2)第五个数为5。 综合数据库:

用一个1到9的序列表示:N = {x},其中x为1到9的数字之一。规则集: r1: IF len(N)=4 THEN {x}∪{5} r2: IF len(N)为偶数and n=In(1, 3, 7, 9) THEN {x}∪{n} r3: IF len(N)为奇数and n=In(2, 4, 6, 8) THEN {x}∪{n} 其中len(N)为求序列的长度,In(a, b, c, d)为取a、b、c、d之一。初始状态:{} 结束条件:得到的序列N前i个数组成的整数能被i整除。

游戏人工智能实验报告四

实验四有限状态机实验 实验报告 一、实验目的 通过蚂蚁世界实验掌握游戏中追有限状态机算法 二、实验仪器 Windows7系统 Microsoft Visual Studio2015 三、实验原理及过程 1)制作菜单 设置参数:点击会弹出对话框,设置一些参数,红、黑蚂蚁的家会在地图上标记出来 运行:设置好参数后点击运行,毒药、食物、水会在地图上随机显示 下一步:2只红蚂蚁和2只黑蚂蚁会随机出现在地图上,窗口右方还会出现红、黑蚂蚁当前数量的统计 不断按下一步,有限状态机就会不断运行,使蚁群产生变化 2)添加加速键 资源视图中 下方

选择ID和键值 3)新建头文件def.h 在AntView.cpp中加入#include"def.h" 与本实验有关的数据大都是在这里定义的 int flag=0; #define kForage 1 #define kGoHome 2 #define kThirsty 3 #define kDead 4 #define kMaxEntities 200 class ai_Entity{ public: int type; int state; int row; int col; ai_Entity(); ~ai_Entity() {} void New (int theType,int theState,int theRow,int theCol); void Forage(); void GoHome(); void Thirsty(); void Dead(); }; ai_Entity entityList[kMaxEntities]; #define kRedAnt 1 #define kBlackAnt 2

(完整word版)哈工大人工智能导论实验报告

人工智能导论实验报告 学院:计算机科学与技术学院 专业:计算机科学与技术 2016.12.20

目录 人工智能导论实验报告 (1) 一、简介(对该实验背景,方法以及目的的理解) (3) 1. 实验背景 (3) 2. 实验方法 (3) 3. 实验目的 (3) 二、方法(对每个问题的分析及解决问题的方法) (4) Q1: Depth First Search (4) Q2: Breadth First Search (4) Q3: Uniform Cost Search (5) Q4: A* Search (6) Q5: Corners Problem: Representation (6) Q6: Corners Problem: Heuristic (6) Q7: Eating All The Dots: Heuristic (7) Q8: Suboptimal Search (7) 三、实验结果(解决每个问题的结果) (7) Q1: Depth First Search (7) Q2: Breadth First Search (9) Q3: Uniform Cost Search (10) Q4: A* Search (12) Q5: Corners Problem: Representation (13) Q6: Corners Problem: Heuristic (14) Q7: Eating All The Dots: Heuristic (14) Q8: Suboptimal Search (15) 自动评分 (15) 四、总结及讨论(对该实验的总结以及任何该实验的启发) (15)

人工智能实验报告大全

人工智能课内实验报告 (8次) 学院:自动化学院 班级:智能1501 姓名:刘少鹏(34) 学号: 06153034

目录 课内实验1:猴子摘香蕉问题的VC编程实现 (1) 课内实验2:编程实现简单动物识别系统的知识表示 (5) 课内实验3:盲目搜索求解8数码问题 (18) 课内实验4:回溯算法求解四皇后问题 (33) 课内实验5:编程实现一字棋游戏 (37) 课内实验6:字句集消解实验 (46) 课内实验7:简单动物识别系统的产生式推理 (66) 课内实验8:编程实现D-S证据推理算法 (78)

人工智能课内实验报告实验1:猴子摘香蕉问题的VC编程实现 学院:自动化学院 班级:智能1501 姓名:刘少鹏(33) 学号: 06153034 日期: 2017-3-8 10:15-12:00

实验1:猴子摘香蕉问题的VC编程实现 一、实验目的 (1)熟悉谓词逻辑表示法; (2)掌握人工智能谓词逻辑中的经典例子——猴子摘香蕉问题的编程实现。 二、编程环境 VC语言 三、问题描述 房子里有一只猴子(即机器人),位于a处。在c处上方的天花板上有一串香蕉,猴子想吃,但摘不到。房间的b处还有一个箱子,如果猴子站到箱子上,就可以摸着天花板。如图1所示,对于上述问题,可以通过谓词逻辑表示法来描述知识。要求通过VC语言编程实现猴子摘香蕉问题的求解过程。 图1 猴子摘香蕉问题 四、源代码 #include unsigned int i; void Monkey_Go_Box(unsigned char x, unsigned char y) {

《人工智能导论》试卷

一、填空: 1.人工智能的研究途径有(1)、(2)和行为模拟。 2.任意列举人工智能的四个应用性领域(3)、(4)、(5)、(6)。 3.人工智能的基本技术包括(7)、(8)、(9)归纳技术、联想技术。 4.谓词逻辑是一种表达能力很强的形式语言,其真值的特点和命题逻辑的区别是 (10)。 5.谓词逻辑中,重言式(tautlogy)的值是(11)。 6.设P是谓词公式,对于P的任何论域,存在P为真的情况,则称P为(12)。 7.在著名的医疗专家系统MYCIN中规定,若证据A的可信度CF(A)=0,则意味 着13 ,CF(A)=-1,则意味着(14),CF(A)=1,则意味着(15)。 8.谓词公式G是不可满足的,当且仅当对所有的解释(16)。 9.谓词公式与其子句集的关系是(17)。 10.利用归结原理证明定理时,若得到的归结式为(18),则结论成立。 11.若C1=┐P∨Q,C2=P∨┐Q,则C1和C2的归结式R(C1,C2)= (19)。 12.若C1=P(x) ∨Q(x),C2=┐P(a) ∨R(y),则C1和C2的归结式R(C1,C2)= (20)。 13.有谓词公式G,置换δ,则G·ε= (21),δ·ε= (22)。 14.有子句集S={P(x),P(y)},其MGU= (23)。 15.在归结原理中,几种常见的归结策略并且具有完备性的是(24),(25),(26)。 16.状态图启发式搜索算法的特点是(27)。 17.广度优先搜索算法中,OPEN表的数据结构实际是一个(28),深度优先搜索算 法中,OPEN表的数据结构实际是一个(29)。 18.产生式系统有三部分组成(30),(31)和推理机。其中推理可分为(32)和 (33)。 19.专家系统的结构包含人机界面、(34),(35),(36),(37)和解 释模块。

人工智能实验报告

计算机科学与技术1341901301 敏 实验一:知识表示方法 一、实验目的 状态空间表示法是人工智能领域最基本的知识表示方法之一,也是进一步学习状态空间搜索策略的基础,本实验通过牧师与野人渡河的问题,强化学生对知识表示的了解和应用,为人工智能后续环节的课程奠定基础。 二、问题描述 有n个牧师和n个野人准备渡河,但只有一条能容纳c个人的小船,为了防止野人侵犯牧师,要求无论在何处,牧师的人数不得少于野人的人数(除非牧师人数为0),且假定野人与牧师都会划船,试设计一个算法,确定他们能否渡过河去,若能,则给出小船来回次数最少的最佳方案。 三、基本要求 输入:牧师人数(即野人人数):n;小船一次最多载人量:c。 输出:若问题无解,则显示Failed,否则,显示Successed输出一组最佳方案。用三元组(X1, X2, X3)表示渡河过程中的状态。并用箭头连接相邻状态以表示迁移过程:初始状态->中间状态->目标状态。 例:当输入n=2,c=2时,输出:221->110->211->010->021->000 其中:X1表示起始岸上的牧师人数;X2表示起始岸上的野人人数;X3表示小船现在位置(1表示起始岸,0表示目的岸)。 要求:写出算法的设计思想和源程序,并以图形用户界面实现人机交互,进行输入和输出结果,如: Please input n: 2 Please input c: 2 Successed or Failed?: Successed Optimal Procedure: 221->110->211->010->021->000 四、算法描述 (1)算法基本思想的文字描述;

人工智能实验报告

实验报告 1.对CLIPS和其运行及推理机制进行介绍 CLIPS是一个基于前向推理语言,用标准C语言编写。它具有高移植性、高扩展性、 强大的知识表达能力和编程方式以及低成本等特点。 CLIPS由两部分组成:知识库、推理机。它的基本语法是: (defmodule< module-n ame >[< comme nt >]) CLIPS的基本结构: (1).知识库由事实库(初始事实+初始对象实例)和规则库组成。 事实库: 表示已知的数据或信息,用deftemplat,deffact定义初始事实表FACTLIS,由关系名、后跟 零个或多个槽以及它们的相关值组成,其格式如下: 模板: (deftemplate [] *) :: = | 事实: (deffacts [] *) 当CLIPS系统启动推理时,会把所有用deffact定义的事实自动添加到工作存储器中。常用命令如下:asser:把事实添加到事实库(工作存储器)中retract:删除指定事实 modify :修改自定义模板事实的槽值duplicate :复制事实 clear:删除所有事实 规则库 表示系统推理的有关知识,用defrule命令来定义,由规则头、后跟零个或多个条件元素以 及行为列表组成,其格式如下: (defrule [] * ; =>

人工智能导论在线作业

人工智能导论在线作业集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]

答:决策树是一种数据挖掘分类算法、是直观运用概率分析的一种图解法、是一个预测模型。 基本方法: 决策树一般由方块结点、圆形结点、方案枝、概率枝等组成,方块结点称为决策结点,由结点引出若干条细支,每条细支代表一个方案,称为方案枝;圆形结点称为状态结点,由状态结点引出若干条细支,表示不同的自然状态,称为概率枝。每条概率枝代表一种自然状态。在每条细枝上标明客观状态的内容和其出现概率。在概率枝的最末稍标明该方案在该自然状态下所达到的结果(收益值或损失值)。这样树形图由左向右,由简到繁展开,组成一个树状网络图。 步骤: a.绘制决策树图。从左到右的顺序画决策树,此过程本身就是对决策问题的再分析过程。 b.按从右到左的顺序计算各方案的期望值,并将结果写在相应方案节点上方。期望值的计算是从右到左沿着决策树的反方向进行计算的。 c.对比各方案的期望值的大小,进行剪枝优选。在舍去备选方案枝上,用“=”记号隔断。 2、什么是知识它有哪些特性列举至少六种知识表示方法 答:经过国内外学者的共同努力,目前已经有许多知识表示方法得到了深入的研究,目前使用较多的知识表示方法主要有:谓词逻辑表示法,产生式表示法、框架表示法、语义网络表示法、表示法、基于本体的知识表示法等。本文将介绍这些知识表示方法的特征和优缺点,进行一些分析和比较。 (1)词逻辑表示法。谓词逻辑表示法是指各种基于(ormalogic)知识表示方式,用逻辑公式描述对象、性质、状况和关系,例如“在轨道上”可以描述成:(npaceshiporbit)它是领域中使用最早和最广泛的知识表示方法之一。其根本目的在于把数学中的逻辑论证符号化,能够采用数学演绎的方式,证明一个新语句是从哪些已知正确的语句推导出来的,那么也就能够断定这个新语句也是正确的。 在这种方法中,识库可以看成一组逻辑公式的集合,识库的修改是增加或删除逻辑公式。使用逻辑法表示知识,将以描述的知识通过引入谓词、函数来加以形式描述,得有关的逻辑公式,而以机器内部代码表示。在逻辑法表示下可采用归结法或其它方法进行准确的推理。

人工智能导论1-4章作业

《人工智能导论》作业(1-4章) 1.人工智能有哪几个主要的学派?各学派的基本理论框架和主要研究方向有何不同?2.用谓词逻辑方法表述下面问题积木世界的问题。 (定义谓词、描述状态、定义操作、给出操作序列) 3.请给出下列描述的语义网络表示: 1)11月5日,NBA常规赛火箭主场对阵小牛,火箭107-76大胜小牛。 2)张老师从9月至12月给自动化专业学生教授《自动控制原理》。李老师从10至12月 给计算机专业学生教授《操作系统原理》。 3)树和草都是植物;树和草都有根和叶;水草是草,生活在水中;果树是树,会结果; 苹果树是果树,结苹果。 4.请用相应谓词公式描述下列语句: 1)有的人喜欢足球、有的人喜欢篮球;有的人既喜欢足球又喜欢篮球。 2)喜欢编程的同学都喜欢计算机。 3)不是每个自控系的学生都喜欢编程。 4)有一个裁缝,他给所有不自己做衣服的人做衣服。 5)如果星期六不下雨,汤姆就会去爬山。 5.什么是谓词公式的解释?对于公式?x ?y (P(x)→Q(f(x),y)) D={1,2,3} 分别给出使公式为真和假的一种解释。 6.什么是合一?求出下面公式的最一般合一: P(f(y), y, x) P(x, f(a),z)。 7.把下面谓词公式化为子句集 ?x ?y (P(x,y)∨Q(x,y))→R(x,y)) ?x (P(x) →?y(P(y)∧R(x,y))

?x (P(x)∧?y(P(y) →R(x,y))) 8.证明下面各题中,G是否是F的逻辑结论? F1: ?x (P(x) →?y(Q(y)→L(x,y))) F2: ?x (P(x)∧?y(R(y) →L(x,y))) G: ?x (R(x) →~Q(x)) F1: ?z (~B(z)→?y(D(z,y)∧C(y))) F2: ?x (E(x)∧A(x)∧?y (D(x,y) →E(y))) F3: ?y(E(y) →~B(y)) G: ?z (E(z) ∧C(z)) 9.已知:John, Mike, Sam是高山俱乐部成员。 高山俱乐部成员都是滑雪运动员或登山运动员(也可以都是)。 登山运动员不喜欢雨。 滑雪运动员都喜欢雪。 凡是Mike喜欢的,John就不喜欢。 凡是Mike 不喜欢的,John就喜欢。 Mike喜欢雨和雪。 问:高山俱乐部是否有一个成员,他是登山运动员,但不是滑雪运动员?如果有,他是谁?10.为什么说归结式是其亲本子句的逻辑结论? 11.何为完备的归结策略?有哪些归结策略是完备的? 12.何谓搜索?有哪些常用的搜索方法?盲目搜索与启发式搜索的根本区别是什么?13.用状态空间法表示问题时,什么是问题的解?什么是最优解?在图搜索算法中,OPEN 表和CLOSED表的作用是什么?f(x)有何不同含义? 14.宽度优先搜索和深度优先搜索有何不同?在何种情况下,宽度优先搜索优于深度优先搜索,何种情况反之? 15.什么是启发式搜索,g(x)与h(x)各有什么作用?A*算法的限制条件是什么?

福州大学《人工智能导论》试卷

福州大学2014~2015学年第2学期考试A卷 课程名称人工智能导论考试日期2015-6-14 考生姓名学号专业或类别 题号一二三四总分累分人 签名题分100 得分 考生注意事项:1、本试卷共8 页,请查看试卷中是否有缺页。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、填空题(每空1分,共20分) 得分评卷人 1. 人工智能三大学派是、和。 2. 在知识表示方法中,与谓词逻辑表示为ISA(LIMING ,MAN)等效的语义网络形式 为。 3.状态空间表示法的两个基本概念是和。 4. 产生式系统由3个部分组成:一个总数据库、、。 5. ANN中文意义是。 6. 反向传播(back-propagation,BP)算法过程是从输出节点开始, ,所以称为“反向传播”。 7. 消解反演证明定理时,若当前归结式是,则定理得证。 8. 子句和P经过消解以后,得到。 9.基于规则的正向演绎系统,其规则形式为,其中前项要满足的条件是。 10. 语义网络下的推理是通过和实现的。 11. 被成为人工智能之父,曾提出一个机器智能的测试模型。 12. 谓词公式(?x)(?y)(?z)(P(x,y)∨Q(y,z)W(z))消去存在量词后,可以化为 。

13. 设E 1=P(a,v,f(g(y))),E 2 =P(z,f(a),f(u)),则E 1 和E 2 的mgu(最一般合一)为 。 14. 进化策略是在父矢量x i ,i=1,2,……p中,通过加入一个 变量以及预先选择x的标准偏差来产生子代矢量x。 二、选择题(每小题2分,共20分) 得分评卷人 1. 在图搜索中,选择最有希望的节点作为下一个要扩展的节点,这种搜索方法叫做( ) A. 宽度搜索 B. 深度搜索 C. 有序搜索 D. 广义搜索 2. 下列人工神经网络属于反馈网络的是() A. Hopfield网 B. BP网络 C. 多层感知器 D. LVQ网络 3. 使用一组槽来描述事件的发生序列,这种知识表示法叫做( ) A. 语义网络法 B. 过程表示法 C. 剧本表示法 D. 框架表示法 4. 产生式系统的推理不包括( ) A. 正向推理 B. 逆向推理 C. 双向推理 D. 简单推理 5. 启发式搜索是寻求问题()解的一种方法 A. 最优 B. 一般 C. 满意 D. 最坏 6. 语义网络表达知识时,有向弧AKO链、ISA链表达节点知识的() A. 无悖性 B. 可扩充性 C. 继承性 D. 完整性 7. 下面表达式对中()是能够合一的。 A. P(q(f(v)),g(u))和P(x,x) B. P(x,f(x))和P(y,y) C. P(y,y,B)和P(z,x,z) D. P(f(A),x),P(x,A) 8. 在遗传算法中,变量x的定义域为 [-2,5],要求其精度为10-6,现用二进制进行编码,

人工智能导论实验

人工智能导论 实验报告 姓名:蔡鹏 学号:1130310726 实验一

一、实验内容 有如下序列,试把所有黑色格移到所有白色格的右边,黄色格代表空格,黑色格和白色格可以和距离不超过三的空格交换。 二、实验代码 #include #include #include #define N 10 #define inf 9999 int g=999; void tree_gener(struct node *fn,struct node *root); struct node { char seq[7]; int f,g,n; struct node *sn[N]; }; struct stack { int num; struct node *n[50]; }; void Enstack(struct node *sn,struct stack *S) { S->n[S->num]=sn; S->num++; } struct node *Destack(struct stack *S) { S->num--; return S->n[S->num]; } void find_min_f(struct node *root) { int i; struct node *n,*min; struct stack S; S.num=0; min=root;

Enstack(root,&S); while(S.num!=0) { n=Destack(&S); if(n->f < min->f) { min=n; } for(i=0;in;i++) { Enstack(n->sn[i],&S); } } tree_gener(min,root); if(g>min->g) { printf("seq:%c %c %c %c %c %c %c | g:%d \n",min->seq[0],min->seq[1],min->seq[2],min->seq[3],min->seq[4],min->seq[5],min->seq[6],min->g); } g=min->g; } void swap(struct node *sn,struct node *fn,int n,int m) { int i; for(i=0;i<7;i++) { sn->seq[i]=fn->seq[i]; } sn->seq[n]=fn->seq[m]; sn->seq[m]=fn->seq[n]; } int calcu_h(char seq[]) { int m=0,n=0,i; for(i=0;i<7;i++) { if(seq[i]=='B') { m++; } if(seq[i]=='W')

人工智能实验报告

人工智能课程项目报告 姓名: 班级:二班

一、实验背景 在新的时代背景下,人工智能这一重要的计算机学科分支,焕发出了他强大的生命力。不仅仅为了完成课程设计,作为计算机专业的学生, 了解他,学习他我认为都是很有必要的。 二、实验目的 识别手写字体0~9 三、实验原理 用K-最近邻算法对数据进行分类。逻辑回归算法(仅分类0和1)四、实验内容 使用knn算法: 1.创建一个1024列矩阵载入训练集每一行存一个训练集 2. 把测试集中的一个文件转化为一个1024列的矩阵。 3.使用knnClassify()进行测试 4.依据k的值,得出结果 使用逻辑回归: 1.创建一个1024列矩阵载入训练集每一行存一个训练集 2. 把测试集中的一个文件转化为一个1024列的矩阵。 3. 使用上式求参数。步长0.07,迭代10次 4.使用参数以及逻辑回归函数对测试数据处理,根据结果判断测试数 据类型。 五、实验结果与分析 5.1 实验环境与工具 Window7旗舰版+ python2.7.10 + numpy(库)+ notepad++(编辑)

Python这一语言的发展是非常迅速的,既然他支持在window下运行就不必去搞虚拟机。 5.2 实验数据集与参数设置 Knn算法: 训练数据1934个,测试数据有946个。

数据包括数字0-9的手写体。每个数字大约有200个样本。 每个样本保持在一个txt文件中。手写体图像本身的大小是32x32的二值图,转换到txt文件保存后,内容也是32x32个数字,0或者1,如下图所 示 建立一个kNN.py脚本文件,文件里面包含三个函数,一个用来生成将每个样本的txt文件转换为对应的一个向量:img2vector(filename):,一个用 来加载整个数据库loadDataSet():,最后就是实现测试。

人工智能导论试卷 (2)

课程名称人工智能导论考试日期2007-6-14 考生姓名学号专业或类别 题号一二三四总分累分人 签名题分100 得分 考生注意事项:1、本试卷共8 页,请查看试卷中是否有缺页。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、填空题(每空1分,共20分) 得分评卷人 1. 人工智能三大学派是符号主义,连接主义,行为主义、和。 2. 在知识表示方法中,与谓词逻辑表示为ISA(LIMING ,MAN)等效的语义网络形式 为。 3.状态空间表示法的两个基本概念是和。状态,操作符 4. 产生式系统由3个部分组成:一个总数据库、一套规则,一个控制策略 、。 5. ANN中文意义是人工神经元网络 。 6. 反向传播(back-propagation,BP)算法过程是从输出节点开始, 将误差信号沿原来的连接通路返回,通过修改各层神经元的连接权值,使误差信号减至最小 ,所以称为“反向传播”。 7. 消解反演证明定理时,若当前归结式是空子句 ,则定理得证。 8. 子句和P经过消解以后,得到 Q 。 9.基于规则的正向演绎系统,其规则形式为,其中前项要满足的条件是。→W或L1∨L2→W,L为单文字

2006~2007学年第2学期考试A卷

13. 设E 1=P(a,v,f(g(y))),E 2 =P(z,f(a),f(u)),则E 1 和E 2 的mgu(最一般合一)为 。 14. 进化策略是在父矢量x i ,i=1,2,……p中,通过加入一个零均方差的高斯随机变量以及预先选择x的标准偏差来产生子代矢量x。 二、选择题(每小题2分,共20分) 得分评卷人 1. 在图搜索中,选择最有希望的节点作为下一个要扩展的节点,这种搜索方法叫做( ) A. 宽度搜索 B. 深度搜索 C. 有序搜索 D. 广义搜索 2. 下列人工神经网络属于反馈网络的是() A. Hopfield网 B. BP网络 C. 多层感知器 D. LVQ网络 3. 使用一组槽来描述事件的发生序列,这种知识表示法叫做( ) A. 语义网络法 B. 过程表示法 C. 剧本表示法 D. 框架表示法 4. 产生式系统的推理不包括( ) A. 正向推理 B. 逆向推理 C. 双向推理 D. 简单推理 5. 启发式搜索是寻求问题()解的一种方法 A. 最优 B. 一般 C. 满意 D. 最坏 6. 语义网络表达知识时,有向弧AKO链、ISA链表达节点知识的() A. 无悖性 B. 可扩充性 C. 继承性 D. 完整性 7. 下面表达式对中()是能够合一的。 A. P(q(f(v)),g(u))和P(x,x) B. P(x,f(x))和P(y,y) C. P(y,y,B)和P(z,x,z) D. P(f(A),x),P(x,A)

人工智能实验报告

《一人工智能方向实习一》 实习报告 专业:计算机科学与技术 班级:12419013 学号: 姓名: 江苏科技大学计算机学院 2016年3月

实验一数据聚类分析 一、实验目的 编程实现数据聚类的算法。 二、实验内容 k-means聚类算法。 三、实验原理方法和手段 k-means算法接受参数k ;然后将事先输入的 n个数据对象划分为 k个聚类以便使得 所获得的聚类满足:同一聚类中的对象相似度较高 四、实验条件 Matlab2014b 五、实验步骤 (1)初始化k个聚类中心。 (2)计算数据集各数据到中心的距离,选取到中心距离最短的为该数据所属类别。 (3)计算(2)分类后,k个类别的中心(即求聚类平均距离) (4)继续执行(2)(3)直到k个聚类中心不再变化(或者数据集所属类别不再变化) 六、实验代码 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % mai n.m % k-mea ns algorithm % @author matcloud %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% clear; close all ; load fisheriris ; X = [meas(:,3) meas(:,4)]; figure; plot(X(:,1),X(:,2), 'ko' ,'MarkerSize' ,4); title( 'fisheriris dataset' , 'FontSize' ,18, 'Color' , 'red'); [idx,ctrs] = kmea ns(X,3); figure; subplot(1,2,1); plot(X(idx==1,1),X(idx==1,2), 'ro' , 'MarkerSize' ,4); hold on;

《人工智能导论》试卷A(答案)

2006~2007学年第2学期考试A 卷 参考答案 一、1. 符号主义,连接主义,行为主义 3.状态,操作符 4.一套规则,一个控制策略 5.人工神经元网络 6.将误差信号沿原来的连接通路返回,通过修改各层神经元的连接权值,使误差信号减至最小 7.空子句 8.Q 9. L→W 或L1∨L2→W,L 为单文字 10.继承,匹配 11.图灵 12. 13. 14. 零均方差的高斯随机 二、CBCDCCADAB 三、1. (1)自然语言理解 (2)人工神经元网络 数据库智能检索 智能控制 专家咨询系统 智能调度和指挥 定理机器证明 智能决策支持系统 博弈 知识发现和数据发掘 机器人学 分布式人工智能 自动程序设计 组合调度问题 感知问题 2.

3.构成:略 特征:(1)能较好的模拟人的形象思维。 (2)具有大规模并行协同处理能力。 (3)具有较强的学习能力。 (4)具有较强的容错能力和联想能力。 (5)是一个大规模自组织、自适应的非线性动力系统。 4.遗传算法是一种随机搜索算法。该算法将优化问题看作是自然界生物的进化过程。模拟大自然生物进化的遗传规律来达到寻优的目的。 5.设A(x):想出国留学 P(x):欲穷千里目 Q(x):更上一层楼 (1)?x(~A(x)) (2)(?x)(Q(x) P(x)) 四、1. 得到的解路径为:S-B-F-J-T 2.启发式搜索图:

状态空间图:

3.

4.证明: R1:所有不贫穷且聪明的人都快乐:?x(~Poor(x)∧Smart(x)→Happy (x)) R2:那些读书的人是聪明的:?x(read(x)→Smart(x)) R3:约翰能读书且不贫穷:read(John)∧ ~Poor(John) R4:快乐的人过着幸福的生活:?x(Happy(x)→Blest(x)) 结论:约翰过着幸福的生活的否定:~ Blest(John) 将上述谓词公式转化为子句集并进行归结如下: 由R1可得子句: Poor(x)∨~Smart(x)∨Happy(x) 由R2可得子句: ~read(y)∨Smart(y) 由R3可得子句: read(John) ~Poor(John) 由R4可得子句: ~ Happy(z)∨Blest(z) 由结论的否定可得子句: ~ Blest(John) 根据以上6条子句,归结如下: ~ Happy(John)⑤⑥ John/z Poor(John)∨~Smart(John)⑦① John/x ~Smart(John)⑧④ ~ read(John)⑨② John/y □⑩③ 由上可得原命题成立。

相关文档