当前位置：文档库 › 年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛

承诺书

我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B 我们的参赛报名号为（如果赛区设置报名号的话）：

所属学校（请填写完整的全名）：西华大学

参赛队员 (打印并签名) ：1. 杨尚安

2. 刘洋

3. 叶军

指导教师或指导教师组负责人 (打印并签名)：

（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。以上内容请仔细核对，提交后将不再允许做任何修改。如填写错误，论文可能被取消评奖资格。）

日期： 2013 年 09 月 15 日赛区评阅编号（由赛区组委会评阅前进行编号）：

2013高教社杯全国大学生数学建模竞赛

编号专用页

赛区评阅编号（由赛区组委会评阅前进行编号）：

全国评阅编号（由全国组委会评阅前进行编号）：

碎纸片的拼接复原

摘要

本文通过分析题中相关要求及条件，建立数学模型解决了各种规则碎纸片的拼接复原问题。

针对问题一，首先将题中所给图片导入matlab软件，利用imread函数得到每张图片的文字灰度像素矩阵，再取出所有矩阵左、右列，建立像素绝对差拟配模型，得到拟配程度最高的两幅图片，进行拼接，出现不合理拼接情况则进行人工干预，最后重复上述过程，完成全部拼接并导出图像。

针对问题二，首先将全部碎片导入matlab软件，经过处理得到每张碎片中符号距离碎片上下端的像素位，再根据分类聚类思想，利用excel表格处理，将所有具有“相同”像素位的图片分为一组，得到11个分组，然后在每一个分组中建立左右连接点数目最匹配模型，再配合人工干预，将所有碎片拼接为一行图像，最后将这11行图像利用问题一中模型拼接为最终图像并打印结果。

针对问题三，首先建立一种基于K-Means局部最优性的高效聚类模型，然后根据模型利用matlab，将所给图片全部导入分类，分好类并人工调整补充后再利用matlab在每一组分类中利用问题二模型在人工干预情况下得出原始图像并打印结果。

关键词：像素绝对差拟配模型左右连接点数目最匹配模型人工干预

一、问题重述

破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题：

1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达（见【结果表达格式说明】）。

2. 对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。

二、模型假设

1、假设全部碎纸片边缘光滑

2、假设字符色调一致

3、假设字符间距相同，没有特殊情况

4、假设除字符外，页面没有其他地方具有任何色彩

5、假设英文字符书写标准，大小写字号均相同

三、符号说明

a表示灰色像素矩阵

n表示灰色像素矩阵的列数

m表示灰色像素矩阵的行数

i表示第几个碎片

a表示某个像素点

m n

b表示某灰度像素点为黑色还是白色

right表示灰色像素矩阵最右边列

)(i

left表示灰色像素矩阵最左边列

)

w表示某个碎片灰色像素矩阵最左列与另一个碎片灰色像素矩阵最右列的差的绝对值的和

四、模型建立与求解

4.1问题一

4.1.1问题分析

整体来看，本问题要求利用数学模型，改原有手动拼接技术为自动或半自动拼接技术，完成题中所给的相应碎纸片的拼接复原工作。

具体操作，考虑所给碎纸片内容仅有汉字或英文，而没有颜色、大小、字形之分。因此，只能利用碎纸片中相应的文字特征进行操作，考虑碎纸片扫描进入在计算机后是以图片的形式存在，而图片又是以像素的情况组成。所以，首先可将图片导入matlab 中，以其像素为基点，得到每个图片的像素矩阵，每一像素矩阵即可表示该图片的特征。为了利用图片像素矩阵完成图片的拼接，考虑问题一只是将原图分为了19列，每一列具有1980像素，首先可根据左端全为空白，找出原图最左一列碎片，然后利用拼接好的图片最右列像素点去匹配未拼接图片的最左列像素点，使得拼接最为吻合的即为需要拼接的图片，然后拼接，再重复上述过程，直到拼接完成。具体操作流程如下：Array

图1 问题一解答流程图

4.1.2数据处理

将图片导入matlab中，然后编写程序（具体代码见附录1），可得每个碎纸片灰度

像素矩阵（碎片000局部像素点如下）。

图2 碎片000局部灰度像素点列

4.1.3像素绝对差拟配模型建立

令碎片导入matlab 编程计算所得的灰色像素矩阵为：

由于碎片像素为72*1980，因此矩阵i a 也是72*1980的，矩阵每一列数据即为碎片相应列像素值，其中每个像素点i m n a 表示此处为黑色或白色，用b 表示某灰度像素点为黑色还是白色，即：

令)(i right 表示灰色像素矩阵最右边列，那么令)(k left 表示灰色像素矩阵最左边列，则

令w 表示某个碎片灰色像素矩阵最左列与另一个碎片灰色像素矩阵最右列的差的绝对值的和。那么有

根据上述模型即可确定某一碎片灰度像素矩阵最右边列与其余未拼接碎片最左边列的绝对差值，下面讨论因差值不同而产生的匹配问题。

1、最左列的确定：当出现某一碎片灰度像素矩阵最左列均为255时，那么说明该碎片为原始图像的最左列。

2、假设出现k w w w w >>>> 321情况，那么首先将k w 对应的碎片与该基准碎片进行拼接，若拼接不合适，这时就需要人工干预，换1-k w 对应的碎片与基准碎片进行拼接。情况如下：

这是不确定的，而进行人工干预选择1-k w 对应的碎片后，将会出现下面情况：这样就能正确的完成两个碎片的拼接。

3、假设出现k w w w w ==== 321情况，这与上述情况相同。因此，人工干预方式及时间选择也相同。

4.1.4像素绝对差拟配模型求解

对于附件一中碎片复原，根据上述模型，利用matlab 软件，求解可得008碎片最

左端矩阵列与006碎片最右端矩阵列均为：???

? ??255255 ，因此，可知008碎片为复原图最左

一个碎片，006碎片为复原图最右端碎片。其余求得所有最小的距离w 的值，根据w 的

对于附录二英文复原，与上求解过程雷同，利用matlab 可得复原结果如下表，复原图

4.1.5问题一综合分析

综上所述，对于问题一的求解过程，未使用人工干预。本文除使用对问题所给的碎片进行复原外，同时对具有相同属性的其他图形碎片也进行了复原，效果良好，模型稳定，可推广到所有只进行竖切的文档恢复。 4.2问题二——中文碎片复原 4.2.1问题分析

综合分析。由于考虑问题二在问题一的基础上将碎片分的更加的细小，那么碎片的灰色像素矩阵数据在原有的基础上将会变得少很多，考虑使用问题一方法及模型，那么

首先就要构造出与问题一相同的19个竖碎片，因此考虑将所有碎片分为19组，但经过试验分为19组后，由于空白出现太多，在每组中将11个碎片拼接在一起是相当困难的。因此，转变思想，考虑将所给所有碎片分为11个组，在每个分组中将19张碎片拼接在一起，然后在将11个分组拼接在一起完成最后解答。

具体操作。要想将11*19张图片分为11组，考虑文字具有行高的性质，分组中所拼接的19张碎片，所有文字具有的行高应该都是相同的。根据这一思想，可将所有碎片导入matlab中，编程计算可得每张碎片符号距离碎片上下端的像素位，并将所有结果导入excel中，然后根据分类与聚类思想，利用excel表格处理，将碎片符号距离碎片上下端的像素位“相同”（不是绝对相等，允许误差前后波动两个像素）的点分为一组，对于出现空白位置误差较大的点可根据单边距离进行分类与聚类，若根据单边无法确定具体分入那组，那么就同时分入可能的分组中。分组完成后那么每个分组中的图片定能拼接为一行图片，那么我们可建立左右连接点数目最匹配模型，结合人工干预，将每个分组中图片拼接在一起。最后利用问题一中模型可将11个分组拼接在一起得到原图。具体流程如下图：

图3 问题二解答流程图

4.2.2数据处理

将209张碎片导入matlab中，编程得到每张碎片灰色像素矩阵，然后在利用矩阵编写程序得到每张碎片字符距离上下边界的像素位，并将其导入excel中（具体代码见

得到像素位上下边缘距离后可根据上下距离“相等”（不是绝对相等，允许误差前后波动两个像素）原则，利用excel表格处理将所给数据分为11组。其中距上边缘距离为0，

在每一分组内，再利用matlab编程计算每张碎片左端与右端具有的可连接点数目（采用四舍五入原则） (具体代码见附录7) ，下表为上一分组数据的左右连接点数目：（其

4.2.3 左右连接点数目最匹配模型]1[

本模型属于半自动模型，需人工干预，具体步骤如下：

1、选取任一分组左右连接点数目情况表，观察左右连接点数；

2、选取左端连接点数目为0的碎片作为最左端碎片，并将该图片作为基准图片；

3、观察基准图片右端连接点数目，从未拼接图片左端连接点数目中找寻与该数目最接近的碎片，人工控制，观察是否可连接。若可连接则拼接上，并将新拼接上碎片作为基本图片，若不可连接，则重新找寻符合要求的碎片，观察是否可连接；

4、重复3步骤，直到将图片全部连接完成。

4.2.4模型求解

以上述模型为标准，考虑数据处理中那行连接过程。首先，寻找19个点钟左端连接数为0的点，找到（94）号碎片，将其作为基准图片，观察其右边连接点数为4，从其余碎片中找寻发现（34）（43）（77）左端连接数均为4，因此，通过人工干预，观察图片字样走势发现只有（34）号碎片符合要求，再将（34）号图片作为基准图片，其右端连接点数为7，从未连接碎片中找寻发现（84）（149）号均为7 ，同理（84）碎片作为基准图片，以此类推即可得到该分组图片排序为：（94）（34）（84）（183）（90）（47）（121）（42）（124）（144）（77）（112）（149）（97）（136）（164）（127）（58）（43）其具体碎片拼接图形如下：

然后根据上述模型，以相同的办法结合附录6中分组情况即可将全部11个分组中图片的连接情况找出，然后利用问题一中像素绝对差拟配模型即可拼接处原图，得到原

表6 汉字碎片拼接情况表

由于解决本问题使用的左右连接点数目最匹配模型，属于半自动模型。因此，对本文的恢复进行了人工干预。恢复此中文文档，本模型一共进行了9次人工干预。

干预方式为：终止程序继续运行，将程序拼接过程恢复至上一步（出现碎片拼接不吻合时的前一步），然后将程序用于拼接的碎片导出，再恢复程序继续运行，找到该步拼接吻合碎片并拼接后，再将导出碎片重新导入继续运行程序。

干预时间节点:干预时间节点即对每行碎片单独拼接时，出现碎片拼接不吻合情况时的节点。

4.3问题二——英文碎片复原

对于附录四英语碎片恢复，由于英文与汉字写法不同，英语中弧线居多，而汉字中直线居多。因此，可以采用另一种方式对英文碎片进行拼接，依然考虑问题一中的像素绝对差拟配模型，可首先任意选择一张基础碎片，然后利用该模型进行适应性匹配，匹

图4 英文碎片复原流程图

4.3.2模型建立

1.1像素绝对值拟配模型

令碎片导入matlab 编程计算所得的灰色像素矩阵为：

由于碎片像素为72*180，因此矩阵i a 也是72*180的，矩阵每一列数据即为碎片相应列像素值，其中每个像素点i m n a 表示此处为黑色或白色。令)(i right 表示灰色像素矩阵最右边列，那么令)(k left 表示灰色像素矩阵最左边列，则

令w 表示某个碎片灰色像素矩阵最左列与另一个碎片灰色像素矩阵最右列的差的绝对值的和。那么有

根据上述模型即可确定某一碎片灰度像素矩阵最右边列与其余未拼接碎片最左边列的绝对差值，下面讨论因差值不同而产生的匹配问题。

1、最左列的确定：当出现某一碎片灰度像素矩阵最左列均为255时，那么说明该碎片为原始图像的最左列。

2、假设出现k w w w w >>>> 321情况，那么首先将k w 对应的碎片与该基准碎片进行拼接，若拼接不合适，这时就需要人工干预，换1-k w 对应的碎片与基准碎片进行拼接。

情况如下：

这是不确定的，而进行人工干预后将会出现下面情况：这样就能正确的完成两个碎片的拼接。

3、假设出现k w w w w ==== 321情况，这与上述情况相同。因此，人工干预方式及时

间选择也相同。 1.2人工干预

在进行像素绝对值拟配模型计算后，将会得到与基准碎片拼接度最大的几个碎片，然后利用这几个碎片可进行人工干预，具体人工干预模型如下：

1、首先将程序计算得到的拟配程度最大的碎片与基准碎片进行拼接；

2、人工判断拼接是否合理；

3、若拼接合理则进行下一次拟配模型计算，若拼接不合理则找寻第一步中与基准碎片拟配差一点的碎片进行拼接；

4、直到找到拼接成功的点才结束本次拼接，并将新拼接上的图片作为基本图片利用模型寻找拟配度最高的碎片，返回第一步。

结合上述模型1.1及1.2可计算得到问题二英文碎片复原图表格如下，具体图像见

由于英文碎片相似程度高于中文图片。所以每一次以基准图片找寻最佳匹配图形时很多时候出现多张图片符合匹配，因此，对此英文碎片的恢复进行了人工干预。恢复此英文文档，本模型一共进行了39次人工干预。

干预方式为：终止程序继续运行，将程序拼接过程恢复至上一步（出现碎片拼接不吻合时的前一步），然后将该步程序用于拼接的碎片导出，再恢复程序继续运行，直到找到与该基准碎片拼接吻合碎片并拼接完成。

干预时间节点:当出现与基准碎片匹配不吻合时。 4.3问题三 4.3.1问题分析

考虑问题三附录中所给图片具有正反面，却不知每一个序号中a 是正面还是b 是正面，这也真是问题二英语复原与问题三双面复原的区别。因此，问题二中所用的分类与聚类的方法不能完成分组。为了完成分组，我们可考虑使用一种更加严密，严苛的分类方法，只要分类完成，那么再使用问题二连接图片的办法即可实现图片的复原。 4.3.2模型建立]2[

许多聚类算法的基本框架是搜索与合并。如在层次方法中需要搜索两个距离最近的类簇然后合并；而基于密度的聚类算法则不断地搜索高密子区域，然后利用连通性将其合并到当前聚类结果中。很明显，搜索过程需要面对整个样本集合，通常会导致算法低效。如DBSCAN 需要测试每个对象是否是核心对象，并对每个核心对象搜索其直接密度可达的对象，如果没有空间索引的辅助，DBSCAN 算法的复杂度为)(2n O 。实际上，现有的很多聚类算法已经关注到这个问题，如CURE 算法利用采样方法减小搜索空间，而Chameleon 算法则通过图划分算法将样本对象聚类为大量相对较小的子簇。具体到本文，我们采用了随机采样和K-Means 算法高效地聚出大量的高密子簇，后续处理都基于这些构造出的高密子簇进行，无须直接面对所有的样本。我们称这种算法框架为构造与合并。因此，K-MeanSCAN 算法的处理流程为：随机采样、预聚类、合并和后处理。聚类算法的本质是密度估计问题，K-MeanSCAN 算法的核心思想是，增加K-Means 算法中高斯混合模型的高斯分量数目以提升密度估计的精度，并利用K-Means 聚类的局部最优和结果敏感性的特征进行高斯分量(即高密子簇)的合并剪枝，克服过拟合问题，最终实现有效的聚类。

K-Means 算法实质上是一种将聚类视为密度估计问题的概率方法。在概率方法中，假设样本来自于如下形式的混合模型:

式中，),,(1k θθ =Θ是待估计的参数向量；条件概率密度),|(j j c x p θ，称为分量密度，表示类别j 的概率密度形式，且参数向量j θ未知；先验概率)(j c p 称为混合因子。为了简化问题，K-Means 算法进一步假设:(1) 每个类别的概率密度形式为球形高斯分布，即),(∑=j j μθ且I ===∑∑212σ ，2,σμj 未知，（2）每个样本唯一地属于一个类别；(3) 假设所有类别的混合因子相等。于是,混合模型简化为

该简化模型可以通过最大似然方法求解,对于观测样本),,(1n x x X =X=(x1,…,xn),相应的对数似然函数为：

最大化该对数似然函数等价于最小化上式的欧氏距离平方项,即得到 K-Means 的误差平方和准则:

通过迭代优化上述的误差平方和准则,K-Means 算法最终可以估计出每个高斯分量的均值向量和协方差矩阵I 2σ=∑。式中,j n 是类簇j c 的样本数目。

要获得更有效的样本密度估计,e J 的值自然是越小越好.但是, e J 的值不仅取决于样本的分类情况,而且与类别数目k 有关.当类别数目k 给定时, e J 的值由样本的分类情况所决定,且存在一个最小值min -k J 对应于最优的样本类别划分.如果类别数目k 和高斯混合模型假设与实际问题相匹配时,最小值m in -k J 必定很小,从而可以很好地近似样本密度;而如果模型假设不合理,则最小值m in -k J 可能依然很大,对样本分布的近似效果较差。

对于任意形状的类簇,很明显不能直接要求数据分布满足高斯混合模型的假设,否则会导致最小的误差平方和m in -k J 很大.实际上,高斯混合模型具有很强的表达能力,如果高斯分量密度的数目k 足够大,则高斯混合模型几乎可以近似任意一种概率分布。换言之,随着类别数目k 的增加,相应的min -k J 会减小。简单证明如下:

类别数目k 的增加,必然导致最终每个类簇的形状缩小,对应于高斯分量的2σ减小；而从公式(3)和公式(4)可以得出2min σnd J k =-,即最小的误差平方和正比于2σ；因此, k 的增加会导致最小的误差平方和min -k J 的减小。极端情况下, n k =,则每个样本点都是一个类簇,即0min =-k J ,说明此时的经验误差为0,但是此时,模型的推广能力极差。根

据统计学习理论,经验误差最小并不等于期望误差最小,经验风险只有在样本数无穷大时才趋近于期望风险.因此,经验误差最小不能保证分类器的推广能力,需要找到经验风险最小和推广能力最大的平衡点。同样,利用足够多的高斯分量组成的混合模型来描述数据会导致过拟合的问题,影响模型的推广能力。因此,在K-MeanSCAN算法中,我们采用过拟合-剪枝的策略进行聚类,即首先使用分量足够多的高斯混合模型来较好地近似样本分布,然后通过合并一些高斯分量的剪枝策略来处理过拟合问题。

4.3.3模型求解

根据上述K-Means局部最优性的高效聚类模型，利用matlab编程计算后结合人为

上述模型求解结束后，结合问题二英文求解模型及人工干预时机，可将原图还原，

对于本问题，由于英语碎片出现正反两面，分类时情况复杂。因此，恢复原文时进行了多次人工干预。

干预方式：对正反英文碎片进行分类结束后，对未归类的碎片，采用人工归类方法，进行多次干预。在每一类中进行碎片拼接时，出现拼接不匹配时，终止程序继续运行，将程序拼接过程恢复至上一步（出现碎片拼接不吻合时的前一步），然后将程序用于拼接的碎片导出，再恢复程序继续运行，找到该步拼接吻合碎片并拼接后，再将导出碎片重新导入继续运行程序。

干预时间节点：分类完成后，对未进行归类的碎片进行人工分类时，还有当进行拼接出现拼接碎片不吻合时。

五、模型评价与推广

5.1模型的优点

使用该模型，可以很好的提高工作效率，将原来使用纯手工拼接过程变得简单合理，而且拼接过程全部在计算机上进行，使得结果更加准确，从碎片出发复原原图像，以点代面的做法，使思路更加简单明了；运用matlab计算及绘出图形，用数形结合的方法来进行分析，模型思路更加清晰，更有说服力。

5.2模型的缺点

模型求解过程中，很多地方使用了人工干预，使得整个过程不能实现完全的智能化。有时的四舍五入也可能是结果有些偏差。

5.3模型的推广

该题所建模型求解的是与相似图形的匹配问题，在实际生活中，与图像相似，匹配，识别相关的问题，均可以使用该模型进行运算。

对于本题问题三，我们也可从另一方面入手考虑，由于每个碎片为180*72像素的，所含信息量较少，因此，使用问题一的方法直接求解不行。如果我们在保证图片大小不变的情况下，增加图片的像素或者寻求另一种模式使碎片分组更加细，那么直接运用方法一求解规则碎片复原将变得相当的容易。

六、参考文献

[1]

[2]

七、附录

附录1，使用软件名称：matlab(daima1)

A=imread('附件1\000.bmp');%区图片的相对路径

附录2，使用软件名称：matlab(daima2)

function Pho1

clc

clear all

A=imread('附件1\000.bmp');%区图片的相对路径

[m,n]=size(A);

pho=ones(m,1)*255;

sort=zeros(1,19);

x=0;

left=zeros(m,1);

right=zeros(m,1);

local=0;

Used=zeros(19,1);

B=zeros(1,19);

for i=1:19 %首先找到最左两边的碎片

if i<11

str=strcat('附件1\00',num2str(i-1),'.bmp');

else

str=strcat('附件1\0',num2str(i-1),'.bmp');

end

a=imread(str);

left=a(:,1);% 取第一列

if length(find(left>250))>1700 %当第一列所有数据为白色时，就定义为这个碎片在图片的最左边

pho=cat(2,pho,a);

Used(i)=1;

x=x+1; %图片的顺序

sort(x)=i-1;

right=a(:,n);% 取最后一列

break;

end

for i=1:18

min=999;

for k=1:19

if Used(k)~=1

if k<11

str=strcat('附件1\00',num2str(k-1),'.bmp');%拼接图片路径 else

str=strcat('附件1\0',num2str(k-1),'.bmp');

end

a=imread(str);

left=a(:,1);% 取第一列

distance=abs(right-left);

temp=sum(sum(distance));

if temp

max=temp;

local=k;

end

if Used(local)~=1 && k==19

if local<11

str1=strcat('附件1\00',num2str(local-1),'.bmp');

else

str1=strcat('附件1\0',num2str(local-1),'.bmp');

end

goal=imread(str1);

pho=cat(2,pho,goal); %将得到的碎片加入到图片中

right=goal(:,n); %取右边

Used(local)=1; %将这个碎片设置为已经使用

x=x+1; %图片的顺序

sort(x)=local-1;

end

pho(:,1)=[];

imshow(pho)

imwrite(pho,'附件1\true1.bmp','bmp')

sort

end

附件3，使用软件名称：matlab(daima3)

%--------附件一拼接---------%

function Pho2

A=imread('附件2\000.bmp');%取图片的相对路径

[m,n]=size(A);

pho=ones(m,1)*255;

sort=zeros(1,19);

x=0;

left=zeros(m,1);

right=zeros(m,1);

local=0;

Used=zeros(19,1);

for i=1:19 %首先找到最左两边的碎片

if i<11

str=strcat('附件2\00',num2str(i-1),'.bmp');

else

str=strcat('附件2\0',num2str(i-1),'.bmp');

end

a=imread(str);

left=a(:,1); % 取第一列

if length(find(left>250))>1900 %当第一列所有数据为白色时，就定义为这个碎片在图片的最左边

pho=cat(2,pho,a);

Used(i)=1;

x=x+1; %图片的顺序

sort(x)=i-1;

right=a(:,n);% 取最后一列

break;

end

for i=1:18

min=

for k=1:19

if Used(k)~=1

if k<11

str=strcat('附件2\00',num2str(k-1),'.bmp');%拼接图片路径

else

str=strcat('附件2\0',num2str(k-1),'.bmp');

end

a=imread(str);

left=a(:,1); % 取第一列

distance=abs(right-left);

temp=sum(sum(distance));

if temp

min=temp;

local=k;

end

if Used(local)~=1 && k==19

if local<11

str1=strcat('附件2\00',num2str(local-1),'.bmp');

else

str1=strcat('附件2\0',num2str(local-1),'.bmp');

end

goal=imread(str1);

pho=cat(2,pho,goal); %将得到的碎片加入到图片中

right=goal(:,n); %取右边

Used(local)=1; %将这个碎片设置为已经使用

x=x+1; %图片的顺序

sort(x)=local-1;

end

pho(:,1)=[];

imshow(pho)

imwrite(pho,'附件2\true.bmp','bmp')

sort

附录4，使用软件：matlab（daima4）

%-----对应图片上下边缘的高度---------%

function read_height

clc

TotleUD=zeros(3,208);

TotleLR=zeros(3,208);

Up_H=zeros(2,208);

Dw_H=zeros(2,208);

L_H=zeros(2,208);

R_H=zeros(2,208);

A=imread('附件3\003.bmp');

[m,n]=size(A);

temp=ones(1,n)*255;

temp1=ones(m,1)*255;

for i=1:209

Up_height=0;

Dw_height=0;

L_height=0;

R_height=0;

if i<11

str=strcat('附件3\00',num2str(i-1),'.bmp'); elseif i>=11&i<101

str=strcat('附件3\0',num2str(i-1),'.bmp'); else

str=strcat('附件3\',num2str(i-1),'.bmp'); end

a=imread(str);

%计算上方高度

k=1;

while a(k,:)==temp

Up_height=Up_height+1;

k=k+1;

end

%计算下方高度

x=m;

while x~=0&a(x,:)==temp

Dw_height=Dw_height+1;

x=x-1;

end

%计算左边高度

for j=1:n

if a(:,j)==temp1

L_height=L_height+1;

else

break;

end

j=n;

while j~=0&a(:,j)==temp1;

R_height=R_height+1;

j=j-1;

end

Dw_H(1,i)=i-1;

Dw_H(2,i)=Dw_height;

Up_H(1,i)=i-1;

Up_H(2,i)=Up_height;

L_H(1,i)=i-1;

L_H(2,i)=L_height;

R_H(1,i)=R_height;

R_H(2,i)=R_height;

TotleUD(1,i)=i-1;

TotleUD(2,i)=Up_height;

TotleUD(3,i)=Dw_height;

TotleLR(1,i)=i-1;

TotleLR(2,i)=L_height;

TotleLR(3,i)=R_height;

end

TotleUD;

TotleLR;

%xlswrite('附件3\上下边界.xls',TotleUD); %xlswrite('附件3\左右边界.xls',TotleLR); End

%计算左右节点

clc;clear all;

A=imread('附件3\000.bmp');

[m,n]=size(A);

countTotle=0;%黑色点的总个数

countSame=0;%相同点的个数

Used=zeros(209,1);

x=0;

pho=ones(m,n)*255;

sort=zeros(1,209);

local=0;

Left=zeros(1,209);

Right=zeros(1,209);

b=zeros(209,1);

for i=1:209;

if i<11

str=strcat('附件3\00',num2str(i-1),'.bmp'); elseif i>=11&&i<101

str=strcat('附件3\0',num2str(i-1),'.bmp'); else i>=101

str=strcat('附件3\',num2str(i-1),'.bmp'); end

a(:,:,i)=imread(str);%第i张图片的像素矩阵

left(:,1,i)=a(:,1,i);%第i张图片的左边第一列

right(:,1,i)=a(:,n,i);%第i张图片的右边第一列

Left(1,i)=length(find(left(:,1,i)==0))/3.2;

Right(1,i)=length(find(right(:,1,i)==0))/3.2;

end

Left

Right

left(:,1,1)';

right(:,1,1)';

pic=cat(2,a(:,:,1),a(:,:,2));

%imshow(pic)

附录8，使用软件：matlab 所有节点左右节点数目

Left =

Columns 1 through 9

7.1875 9.3750 5.3125 1.2500 0.9375 3.1250 3.4375 0 1.8750 Columns 10 through 18

2.1875 9.0625 0.9375 12.1875 5.0000 0 2.5000 9.6875 8.1250 Columns 19 through 27

5.3125 13.1250 2.8125 2.1875 5.6250 0.9375 11.2500 8.4375 17.1875 Columns 28 through 36

13.7500 7.1875 0 3.4375 5.0000 3.1250 10.3125 4.6875 2.1875 Columns 37 through 45

3.7500 8.1250 0 7.1875 10.6250 12.5000 12.5000 11.8750 7.5000 Columns 46 through 54

9.0625 0.3125 4.6875 13.4375 0 2.1875 5.0000 14.0625 12.5000 Columns 55 through 63

5.9375 4.0625 2.5000 2.8125 1

6.2500 1.8750 3.4375 0 0 Columns 64 through 72

5.0000 5.3125 4.6875 2.1875 0 10.6250 5.6250 3.1250 0 Columns 73 through 81

5.6250 2.8125 4.3750 12.1875

6.8750 3.4375 2.1875 6.8750 0 Columns 82 through 90

1.8750 7.5000 1.2500 4.0625 5.3125

2.8125 6.5625 4.3750 0 Columns 91 through 99

8.7500 5.6250 4.3750 12.5000 0 8.4375 4.3750 15.3125 4.0625 Columns 100 through 108

8.4375 6.2500 4.6875 0 6.8750 0.9375 2.1875 0 5.3125 Columns 109 through 117

5.9375 2.8125 15.3125 1.2500 5.3125

6.2500 2.5000 10.6250 6.5625 Columns 118 through 126

1.5625 0.6250 1.8750

2.1875

3.4375 2.8125 0.9375 6.8750 0 Columns 127 through 135

5.0000 3.7500 4.0625 0 8.7500 19.3750 2.5000

6.8750 1.5625 Columns 136 through 144

0 1.8750 13.1250 0.3125 1.2500 1.5625 4.3750 9.0625 0 Columns 145 through 153

9.0625 1.8750 0.6250 5.0000 5.0000 6.5625 4.3750 3.4375 12.1875 Columns 154 through 162

2.5000 4.0625

3.1250 10.3125 6.5625 3.1250

4.0625 6.5625 1.8750 Columns 163 through 171

3.4375 1.5625 9.3750 5.3125

4.0625 0.6250 0 9.0625 9.0625 Columns 172 through 180

3.7500

4.0625 2.8125 11.8750 1.2500 2.1875 4.6875 14.0625 8.4375

2013年数学建模碎纸片的拼接复原模型

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B 我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：参赛队员 (打印并签名) ：1. 2. 3. 指导教师或指导教师组负责人 (打印并签名)：（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。以上内容请仔细核对，提交后将不再允许做任何修改。如填写错误，论文可能被取消评奖资格。）日期： 2013 年 9 月 10 日赛区评阅编号（由赛区组委会评阅前进行编号）：

编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国评阅编号（由全国组委会评阅前进行编号）：碎纸片的拼接复原模型摘要：本文针对碎纸片的拼接复原问题，提出了互相关匹配模型。首先对附件图片数值化处理并建立矩阵；然后根据图像页边距特点定位最左边和最右边的碎片；按照每张碎片中的文字部分所在位置，提取同一行碎片，利用互相关函数横向拼合。在第一问中，附件一、二仅作横向相关性比较即可；在第二、三问中，需要提取同一行碎片横向拼接，并将横向拼合完整的碎片进行竖向拼合，经过人工干预得到结果。最终结果见附录。关键词：拼接复原；互相关；矩阵；数值化；人工干预

规则碎纸片的拼接复原

论文检测报告报告编号： 5d95e0aadf5149a5a9ef1ecb397c466d 送检文档：规则碎纸片的拼接复原论文作者：陈芳芳文档字数： 2981 检测时间： 2015-01-07 12:39:34 检测范围：论文库，中文期刊库（涵盖中国期刊论文网络数据库、中文科技期刊数据库、中文重要学术期刊库、中国重要社科期刊库、中国重要文科期刊库、中国中文报刊报纸数据库等），Tonda论文库（涵盖中国学位论文数据库、中国优秀硕博论文数据库、部分高校特色论文库、重要外文期刊数据库如Emerald、HeinOnline、JSTOR等），资源共享库。一、检测结果：总相似比： 36.05% [即复写率与引用率之和] 检测指标：自写率 63.95%复写率 36.05%引用率 0.0% 相似比：互联网 36.05% 学术期刊 0.0% 学位论文 0.0% 资源共享 0.0% 其他指标：表格 0 个脚注 0 个尾注 0 个

章节抄袭比 36.05% 规则碎纸片的拼接复原二、相似文献汇总：序号标题文献来源作者出处发表时间11213年碎纸片拼接复原数模论文互联网互联网 213年碎纸片拼接复原数模论文-豆丁网互联网互联网 32013年全国大学生数学建模竞赛国家一等奖论文B题碎纸片的拼接...互联网互联网 4【图】科密碎纸机深圳碎纸机黑金刚碎纸机可碎光碟 - 罗湖办公...互联网互联网 5一种碎纸自动拼接中的形状匹配方法-《计算机仿真》2006年11期-...互联网互联网 6国家奖碎纸片的拼接还原_百度文库互联网互联网

7基于蚁群优化算法的碎纸拼接-豆丁网互联网互联网 8求2013数学建模题B题(2)的中文原题以及附件3不胜感激_百度知道互联网互联网 9沈阳建筑大学_徐俊杰.郭书恒.唐杰_百度文库互联网互联网 10碎纸机批发,厂家,图片,商贸城-马可波罗网互联网互联网三、全文相似详情：（红色字体为相似片段、浅蓝色字体为引用片段、深蓝色字体为可能遗漏的但被系统识别到与参考文献列表对应的引用片段、黑色字体为自写片段）碎纸机，是用来切碎销毁纸张的机器，为了达到废弃文件保密的目的，要把纸张分割成很多的细小纸片，碎纸机切割的纸粒工整利落，能达到保密的效果。随着数据时代发展，大量的政府机关、企事业单位都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。碎纸方式是指当纸张经过碎纸机处理后被碎纸刀切碎后的形状。市面上有些碎纸机可选择两种或两种以上的碎纸方式。不同的碎纸方式适用于不同的场合，如果是一般性的办公场合则选择段状、粒状、丝状，条状的就可以了。但如果是用到一些对保密要求比较高的场合就一定要用沫状的。随着现代技术的不断发展和市场的需求，现在的碎纸机，除了对纸张的处理，也可以对信用卡、光盘等进行切割。本文研究的只是针对印刷文字文件在碎纸机中被切割的碎片，它是规则的黑白图片，对于非印刷文字文件的碎纸片、彩色碎纸片、形状不规则或边缘有破损的碎纸片等都是该碎纸片拼接技术的重要影响因素。随着科学技术的不断发展，人们对信息交流、存储和销毁的需求也不断的增加。目前，大量政府机关、企事业单位都是用打印机来打印文件，也都采用了碎纸机对废弃文件或失效的机密文件进行破碎处理。当遇到误销毁的文件时，就要靠人工对碎纸片进行拼接，而人工拼接工作量大，不仅费力耗时，可能还会出现拼接错误等情况。如果应用当前的图像处理与模式识别技术来开发碎纸片的自动拼接技术，用计算机对所有碎片进行搜索和筛选，对能够在某种指标上匹配的碎片进行拼接复原。这样会大大的提高拼接复原的效率，从而降低了人工的工作量和难度。目前在情报资料碎片整理、司法技术鉴定等领域中, 碎纸的拼接工作大部分都是靠人工的方式完成。虽然国外对这项工作有进行了一些研究, 但是由于碎纸的自动修复技术应用背景的特殊性, 目前几乎没有公开的研究资料可以参考。类似的研究主要是集中在文物碎片的自动修复、虚拟考古、故障分析以及计算机辅助设计、医学分析等领域。所以对规则碎片自动拼接问题的研究，不仅具有广阔的应用前景，而且具有很强的理论意义。问题1：对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（纵切），建立碎纸片拼接复原模型和算法，针对附件1、附件2针对文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。分析：针对问题1，在附件一及附件二中，碎纸片仅纵切，则纸片边缘的字有可能出现完整、残缺、标点符、空格四种情况，每个字又由多个像素点组成，故我们利用Matlab图像处理函数imread（）将各个碎片文字像素二值化，并取出代表各个碎片左右两边缘的像素点的列向量，如此在每张碎片左右两边缘所获的值都可组成一组向量，且分别设左边缘 ,右边缘（）。设复原图像的第1列像素为向量，第72列像素为向量列，以此类推直到最后一列像素为。因为原图像的第一列像素全为255（白色），所以可找出，从而可以确定和对应的和，将该碎纸片数据放入向量A中，再将列向量逐一与剩下的所有图片的列向量元素作差，列方向绝对值求和，则和最小的就是能与匹配的碎片，以此类推。匹配完成后用Matlab图像处

碎纸片的拼接复原数学模型的构建

碎纸片的拼接复原数学模型的构建发表时间：2014-11-27T14:26:53.797Z 来源：《价值工程》2014年第9月上旬供稿作者：毕楷明[导读] 以纵横方式破碎纸片，利用同行文字行间距一致性的主要特性可解决横向碎纸片的拼接复原问题。Construction of Mathematical Model of Splicing Scrap Recovery毕楷明BI Kai-ming（东北大学理学院，沈阳110819）（NEU College of Sciences，Shenyang 110819，China）摘要院本文讨论在碎纸机以不同方式破碎纸片的情况下建立碎纸片的拼接复原模型，以解决碎片数量巨大时人工拼接的难题，本文建立了三个具有针对性的模型。模型一：方差分析法下的碎纸片拼接模型。在以纵切方式破碎纸片的情况下，提取碎纸片左右边缘的灰度列向量，利用碎纸片边缘处为单边同宽空白区域的特殊性对碎纸片进行定位，再利用方差分析法和欧式距离解决了纵切碎纸片的拼接复原问题。模型二：文字行间距一致性的碎纸片拼接模型。以纵横方式破碎纸片，利用同行文字行间距一致性的主要特性可解决横向碎纸片的拼接复原问题，简化了模型，将离散的像素灰度矩阵平均化处理，进而利用欧氏距离对碎纸片进行匹配，得到了碎纸片复原后的完整图片。模型三：二值化Otsu 算法的碎纸片拼接复原模型。本文从双面纵横破碎纸片的问题出发，建立了纸片二值化Otsu 法拼接模型，先对碎纸片分组预处理，为将复杂模型简单化，再利用全局阈值方法中典型的Otsu 法求取碎纸片的最佳阈值，以该阈值对碎纸片中所含灰度值信息进行划分实现二值化处理，将边缘区域明显化，利用统计学方法求取拼接后的纸片间成功匹配的像素点占纸片边缘的概率，最终双面纵横破碎纸片的拼接复原问题得以解决。Abstract: This paper discusses the construction of splicing scrap recovery model under the condition of shredder breaking paper intopieces in different ways, so as to solve the problem of artificial splicing when there is a great amount of pieces. This paper establishes threecorresponding model.Model One: Paper Scrap Splicing Model under Analysis of Variance.Shredding paper through longitudinal mode, the paper selects the gray scraps of paper around the edge extraction column vector,locates the paper scrap by using edge of paper scraps as blank area with same width, then solves the problem of reconstruction of thelongitudinal cutting paper splicing through analysis of variance method and Euclid Distance.Model Two: Paper Scrap Splicing Model with Consistency of Text Line Spacing.Shredding paper through vertical and horizontal mode, its main characteristics of peer text line spacing consistency can solve theproblem of reconstruction of splicing transverse paper scraps, simplifies the model, processes the pixel matrix of discrete in average andmatches the paper scraps through Euclid Distance and then gets the complete picture of paper scrap after recovery.Model Three: Paper Scrap Splicing Model Based on Binaryzation Otsu Algorithm.This paper firstly expounds the double side's vertical and horizontal mode, establishes the paper scrap splicing model based onbinaryzation Otsu algorithm. The paper firstly does preconditioning for paper scraps into groups, simplifies the complex model, and then getsthe optimal threshold of the paper scraps by using typical Otsu algorithm of global threshold method. The paper classifies the gray valueinformation of paper scraps through this threshold to realize binaryzation processing, specifies the edge area, evaluates the probability ofsuccessful matching pixels on edge of splicing paper, and finally solves the mosaic and restoration problems of double side's vertical andhorizontal mode. 关键词院离散；方差分析；置信区间；阈值；Otsu 算法Key words: discrete；analysis of variance；confidence interval；threshold；Otsu algorithm中图分类号院TQ018 文献标识码院A 文章编号院1006-4311（2014）25-0238-031 模型一考虑以为空间拼接情况，为了获取拼接图像所必须的数据，文章以像素为单位离散所得碎片：利用VC++使用了Windows.H 头文件并调用RGB 等结构定义获得不同像素点的g 值[1]，生成了多个灰度矩阵。由于本题主要研究碎片的拼接，故只需考虑碎片的边缘部分，故分别提取全部碎片的最左侧和最右侧的g 值列向量：文章分别找出其中最左侧g 值列向量的值全为255（即像素全白）的和最右侧g 值列向量的值全为255 的两个碎片，于是左侧g 值全为255 的碎片对应左一位置，同理右侧g 值全为255 的碎片对应左一位置。再考虑剩余的碎片（本文中考虑18 个碎片）的对号入座问题，使最左侧碎片分别与其他碎片的最左侧灰度g 值列向量进行相同y 值下作差，得到不同碎片的G 差。先求出左一位置碎片最右侧g 值列向量：

碎纸片拼接复原问题研究

基于旅行商规划模型的碎纸片拼接复原问题研究摘要本文分别针对RSSTD(Reconstruction of Strip Shredded Text Document）、RCCSTD(Reconstruction of cross-cut Shredded Text Document)和Two-Sides RCCSTD三种类型的碎纸片拼接复原问题进行了建模与求解算法设计。首先我们对于RSSTD问题，建立了基于二值匹配度的TSP模型，并将其转化为线性规划模型，利用贪心策略复原了该问题的中文和英文碎片；然后对于RCCSTD问题，由于中英文字的差别，我们分别建立了基于改进误差评估的汉字拼接模型和基于文字基线的误差评估的英文字拼接模型，并利用误差评估匹配算法，复原了该问题的中文和英文碎片；随后我们针对正反两面的RCCSTD 问题，利用基线的概念将正反两面分行，转化为RCCSTD问题，并复原了该问题的英文碎片。最后，我们对模型的算法和结果进行了检验和分析。 ◎问题一：我们针对仅纵切的情况，首先将图像进行数字化处理，转换为了二值图像，然后得到各图像的边缘，并计算所有碎片与其他碎片边缘的匹配程度。然后，根据两两碎片之间的匹配程度建立了TSP模型，并将其划归为线性规划模型。最终，我们根据左边距的信息确定了左边第一碎片，随后设计了基于匹配度的贪心算法从左向右得到了所有碎片的拼接复原结果。结果表明我们的方法对于中英文

两种情况适用性均较好，且该过程不需要人工干预。 ◎问题二：我们针对既纵切又横切的情况，由于中英文的差异性，我们在进行分行聚类时应采用不同的标准。首先根据左右边距的信息确定了左边和右边的碎片，随后分别利用基于改进误差评估的汉字拼接模型和基于文字基线的误差评估模型，将剩余的碎片进行分行聚类，然后再利用基于误差评估的行内匹配算法对行内进行了拼接，最终利用行间匹配算法对行间的碎片进行了再拼接，最终得到了拼接复原结果。对于拼接过程中可能出现误判的情况，我们利用GUI 编写了人机交互的人工干预界面，用人的直觉判断提高匹配的成功率和完整性。 ◎问题三：我们针对正反两面的情况，首先根据正反基线信息，分别确定了左右两边的碎片，然后利用基线差值将其两两聚类，聚类以后其正反方向也一并确定，随后我们将其与剩余碎片进行分行聚类，最终又利用行内匹配和行间匹配算法得到了最终拼接复原结果。其中，对于可能出现的误判情况，我们同样在匹配算法中使用了基于GUI的人机交互干预方式，利用人的直觉提高了结果的可靠性和完整性。关键字：碎片复原、TSP、误差评估匹配、基线误差、人工干预

碎纸片的拼接复原的数学模型

碎纸片的拼接复原摘要本文主要采用了模糊模型识别、灰度相关、傅里叶变换等方法对碎纸自动拼接进行了深入探讨。文中主要结合司法物证复原、历史文献修复、军事情报获取这一背景，针对横纵切碎自动拼接展开探究。提出一种基于最大梯度和灰度相关的全景图拼接法。同时采用边界提取法使图像预处理达到最好的效果，期间采用傅里叶变换对图像进行处理，最后再利用匹配准则等方法处理图像的拼接。最终应用模糊模型识别法建立模型，通过隶属函数的建立实现最终的碎纸拼接。期间有些碎纸片计算机无法识别，需要进行人工干预，从而才能得到一副完整的复原图。图像拼接的主要工作流程可以概括为以下三个步骤：（1）对图像碎片进行预处理，即对物体碎片数字化，得到碎片的数字图像。（2）图像碎片匹配，通过匹配算法找到相互匹配的图像碎片。（3）图像碎片的拼接合并，将相互匹配的图像碎片拼接在一起得到最终结果。 ! 针对问题一：将图像导入MATLAB 进行相应的转化，由于数据量较大，所以对数据进行优化提取。计算提取数据的均值与方差，找出其模糊集，建立符合题意的隶属函数。由于模糊集的边界是模糊的，如果要把模糊概念转化为数学语言，需要选取不同的置信水平(01)λλ≤≤ 来确定其隶属关系，从而实现纵切图像的全景拼接。（如表一、表二）针对于问题二：由于是横纵切碎纸片，所得图像较多，采用提取像素法对图片进行灰度分析，通过中介量阈值的确定来找出像素点的差别，梯度值在这一过程中也是作为衡量两张碎纸片是否匹配的标准。从而对数据进行处理，最后导入MATLAB 软件实现拼接。（如表三、表四）针对问题三：它是在问题一和问题二上加深了难度，采用提取像素点，傅里叶变换，灰度相关、模糊相似优先比等方法对问题进行分析，通过（0,1）矩阵的简化运算以及傅里叶变换得到最后的结果，但对于傅里叶变换需说明一点，变换之后的图像在原点平移之前四角是低频，最亮，平移之后中间是低频最亮，也就是说幅角比较大。此过程中同时也需要人工干预，最终实现拼接。（如表五、表六）

年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B 我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：西华大学参赛队员 (打印并签名) ：1. 杨尚安 2. 刘洋 3. 叶军指导教师或指导教师组负责人 (打印并签名)：（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。以上内容请仔细核对，提交后将不再允许做任何修改。如填写错误，论文可能被取消评奖资格。）日期： 2013 年 09 月 15 日赛区评阅编号（由赛区组委会评阅前进行编号）：

2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国评阅编号（由全国组委会评阅前进行编号）：

碎纸片的拼接复原

全国大学生数学建模竞赛论文格式规范本科组参赛队从A、B题中任选一题，专科组参赛队从C、D题中任选一题。（全国评奖时，每个组别一、二等奖的总名额按每道题参赛队数的比例分配；但全国一等奖名额的一半将平均分配给本组别的每道题，另一半按每题论文数的比例分配。）论文用白色A4纸打印；上下左右各留出至少2.5厘米的页边距；从左侧装订。 ●论文第一页为承诺书，具体内容和格式见本规范第二页。 ●论文第二页为编号专用页，用于赛区和全国评阅前后对论文进行编号，具体内容和格式见本规范第三页。 ●论文题目、摘要和关键词写在论文第三页上（无需译成英文），并从此页开始编写页码；页码必须位于每页页脚中部，用阿拉伯数字从“1”开始连续编号。注意：摘要应该是一份简明扼要的详细摘要，请认真书写（但篇幅不能超过一页）。 ●从第四页开始是论文正文（不要目录）。论文不能有页眉或任何可能显示答题人身份和所在学校等的信息。 ●论文应该思路清晰，表达简洁（正文尽量控制在20页以内，附录页数不限）。 ●引用别人的成果或其他公开的资料(包括网上查到的资料) 必须按照规定的参考文献的表述方式在正文引用处和参考文献中均明确列出。正文引用处用方括号标示参考文献的编号，如[1][3]等；引用书籍还必须指出页码。参考文献按正文中的引用次序列出，其中书籍的表述方式为： [编号] 作者，书名，出版地：出版社，出版年。参考文献中期刊杂志论文的表述方式为： [编号] 作者，论文名，杂志名，卷期号：起止页码，出版年。参考文献中网上资源的表述方式为： [编号] 作者，资源标题，网址，访问时间（年月日）。 ●在论文纸质版附录中，应给出参赛者实际使用的软件名称、命令和编写的全部计算机源程序（若有的话）。同时，所有源程序文件必须放入论文电子版中备查。论文及源程序电子版压缩在一个文件中，一般不要超过20MB，且应与纸质版同时提交。（如果发现程序不能运行，或者运行结果与论文中报告的不一致，该论文可能会被认定为弄虚作假而被取消评奖资格。） ●本规范中未作规定的，如排版格式（字号、字体、行距、颜色等）不做统一要求，可由赛区自行决定。 ●在不违反本规范的前提下，各赛区可以对论文增加其他要求（如在本规范要求的第一页前增加其他页和其他信息，或在论文的最后增加空白页等）。 ●不符合本格式规范的论文将被视为违反竞赛规则，无条件取消评奖资格。 ●本规范的解释权属于全国大学生数学建模竞赛组委会。 [注] 赛区评阅前将论文第一页取下保存，同时在第一页和第二页建立“赛区评阅编号”（由各赛区规定编号方式），“赛区评阅纪录”表格可供赛区评阅时使用（各赛区自行决定是否在评阅时使用该表格）。评阅后，赛区对送全国评阅的论文在第二页建立“全国统一编号”（编号方式由全国组委会规定，与去年格式相同），然后送全国评阅。论文第二页（编号页）由全国组委会评阅前取下保存，同时在第二页建立“全国评阅编号”。全国大学生数学建模竞赛组委会 2013年8月26日修订

碎纸片拼接复原数模论文b

碎纸片拼接复原数模论文b Revised as of 23 November 2020

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B 我们的参赛报名号为（如果赛区设置报名号的话）：所属学校（请填写完整的全名）：重庆XX大学参赛队员 (打印并签名) ：1. 祝XX 2. 冯XX 3. 周XX 指导教师或指导教师组负责人 (打印并签名)：张XX （论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。以上内容请仔细核对，提交后将不再允许做任何修改。如填写错误，论文可能被取消评奖资格。）日期： 20XX 年 X 月 XX 日赛区评阅编号（由赛区组委会评阅前进行编号）：

2013国赛B题碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛题目（请先阅读“全国大学生数学建模竞赛论文格式规范”） B题碎纸片的拼接复原破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题： 1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达（见【结果表达格式说明】）。 2. 对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。 3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。【数据文件说明】 (1)每一附件为同一页纸的碎片数据。 (2)附件1、附件2为纵切碎片数据，每页纸被切为19条碎片。 (3)附件3、附件4为纵横切碎片数据，每页纸被切为11×19个碎片。 (4)附件5为纵横切碎片数据，每页纸被切为11×19个碎片，每个碎片有正反两面。该附件中每一碎片对应两个文件，共有2×11×19个文件，例如，第一个碎片的两面分别对应文件000a、000b。【结果表达格式说明】复原图片放入附录中，表格表达格式如下： (1)附件1、附件2的结果：将碎片序号按复原后顺序填入1×19的表格； (2)附件3、附件4的结果：将碎片序号按复原后顺序填入11×19的表格； (3)附件5的结果：将碎片序号按复原后顺序填入两个11×19的表格； (4)不能确定复原位置的碎片，可不填入上述表格，单独列表。

碎纸片的拼接复原问题

2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（由全国组委会评阅前进行编号）：

碎纸片的拼接复原问题摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。本文针对已给图像先进行了图片灰度二值化处理得到碎纸片的像素矩阵，提取碎纸片的边缘像素矩阵，对边缘矩阵进行相似度分析，相似度的度量采用向量距离平方和最小化，在相似度度量中设置阈值、对相近相似度的候选纸片进行人工干预、对数据量较大的附件，采用文本特征，如页边距、行距进行筛选，降低计算量，提高计算精度。使用Matlab软件编程实现了上述算法，在对附件的拼接中通过少量的人工干预，可实现纸片的完整拼接，效果较好。关键词：相似度；文字特征；碎纸片拼接；Matlab；

1 问题重述 1.1 问题的描述设计一个碎纸片的自动拼接模型，以提高碎纸片的拼接复原效率。 1.2 问题的要求（1）对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。（2）对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。（3）从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。 1.3 问题的分析对破碎文件这类边缘相似的碎纸片的拼接，理想的计算机拼接过程应与人工拼接过程类似，即拼接时不但要考虑待拼接碎纸片边缘是否匹配，还要判断碎纸片内的字迹断线或碎片内的文字内容是否匹配，然而由于理论和技术的限制，让计算机具备类似人那种识别破碎边缘地字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。但是分析了基于几何特征的碎纸片自动拼接方法的缺点,研究了碎纸片内文字行特征以及行特征获取方法。利用这些信息进行拼接，其拼接效率无疑比单纯利用边界几何特征方法要好些。另一方面由于计算机数字分析图像能力的缺陷，让计算机对碎片进行完全意义上的自动化拼接也几乎不大可能，这就需要我们在拼接过程加入人工干扰过程，对一些碎片进一步分析结果舍弃或拼接待选。 2 模型假设和符号系统

碎纸片拼接复原的数学模型与实现

碎纸片拼接复原的数学模型与实现摘要碎纸拼接,就是利用计算机将碎片复原.如果碎片的数量过大,手工拼接会费时费力. 本文利用MATLAB实现碎片自动拼接,解决了如何复原一个纵切印刷文字文件破碎纸片,如何复原一个即纵切又横切的印刷文字文件破碎纸片,如何复原一个即纵切又横切的双面印刷文字文件破碎纸片. 关键词碎纸片;像素;灰度;邻接;MATLAB;复原. 中图分类号0141.41 Mathematical model stitching scraps of paper and achieve recovery （School of Mathematics and Statistics，Hexi University，Zhangye，Gansu，734000）Abstract:Shredding splicing, is to use the computer to recover the debris. If the number of fragments is too large, hand-stitching dues when consuming. In this paper, using Matlab automatic mosaic fragments, Addresses how to recover a broken piece of paper slitting printing text documents, How to recover a longitudinal and transverse to that file fragmentation paper printed text, How to recover a longitudinal and cross that double-sided printed paper text file fragmentation. Keywords:Scraps of paper; Pixel; Grayscale; Adjacency; Matlab; Recovery. 1 问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用.传统上,拼接复原工作需由人工完成,准确率较高,但效率很低.特别是当碎片数量巨大,人工拼接很难在短时间内完成任务.随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率.现给出下列三种情形 (1)对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切）,建立碎纸片拼接复原模型和算法,如针对给出的同一页中文文件（图片集1）的碎片数据进行拼接复原. (2)对于碎纸机既纵切又横切的情形,建立碎纸片拼接复原模型和算法,如针对给出的同一页中文文件（图片集2）的碎片数据进行拼接复原. (3)上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决.现给出一页英文印刷文字双面打印文件（图片集3）的碎片数据. 图片文件说明： (1)每一图片集为同一页纸的碎片数据. (2)图片集1为纵切碎片数据,每页纸被切为19条碎片（随机编号为00-19）. ?个碎片（随机编号为(3)图片集2为纵横切碎片数据,每页纸被切为1119 000-208）. (4)图片集3为纵横切碎片数据,每页纸被切为1119 ?个碎片,每个碎片有正反两面.

2013年数学建模B题碎纸片的拼接复原

B题　碎纸片的拼接复原破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题： 1．对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达（见【结果表达格式说明】）。 2．对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。 3．上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。【数据文件说明】

（1）每一附件为同一页纸的碎片数据。（2）附件1、附件2为纵切碎片数据，每页纸被切为19条碎片。（3）附件3、附件4为纵横切碎片数据，每页纸被切为 11×19个碎片。（4）附件5为纵横切碎片数据，每页纸被切为11×19个碎片，每个碎片有正反两面。该附件中每一碎片对应两个文件，共有2×11×19个文件，例如，第一个碎片的两面分别对应文件 000a、000b。【结果表达格式说明】复原图片放入附录中，表格表达格式如下：（1）附件1、附件2的结果：将碎片序号按复原后顺序填入 1×19的表格；（2）附件3、附件4的结果：将碎片序号按复原后顺序填入11×19的表格；（3）附件5的结果：将碎片序号按复原后顺序填入两个 11×19的表格；

碎纸片的拼接复原问题大学生数学建模全国一等奖论文

碎纸片的拼接复原问题摘要为解决碎纸片的拼接复原问题，我们通过定义差异度指数、高度差，建立0-1规划模型，使用聚类分析、MATLAB搜索算法和人工干预等相结合，得到了所有附件复原序号和复原图片。针对问题一，首先提取附件1、2中所有碎片左侧和右侧边缘灰度，通过任意列碎片右侧和任意列碎片左侧的边缘灰度差值可以定义差异度指数，从而得到差异度特征矩阵，然后建立0-1规划模型，以第i张碎片右侧与第j张碎片左侧差异度最小为目标函数，以第i张碎片右侧与第j张碎片左侧是否相连为决策变量，以每张碎片右侧一定与某张碎片左侧相连、每张碎片左侧一定与某张碎片右侧相连为约束条件。算法为先提取任意张碎片边缘灰度值，得到差异度矩阵，带入规划模型中，通过LINGO软件找到中英文碎片的拼接方法，得到复原序号如表一、表二，从而得到出中文与英文复原图片。表一:中文碎片的复原序号表二：英文碎片的复原序号片拼接方法。结果表明两种方法得出的中英文复原顺序相同，复原图片相同，同时人工检验中英文复原图片中无明显语法、单词错误，证明复原图片准确。针对问题二，由于每张碎片有左侧、右侧和上侧、下侧，与问题一相同，可以定义两个差异度指数，建立双目标0-1规划模型。但由于差异度矩阵过大，决策变量复杂，我们又建立了改进的简化模型，定义高度差，运用聚类分析方法，按照高度不同将所有碎片分为18类，然后再以第j块碎片左侧与第i块碎片右侧的差异度最小为目标函数，以第i块碎片右侧与第j块碎片左侧是否相连为决策变量，以每块碎片右侧一定与某块碎片左侧相连、每块碎片左侧一定与某块碎片右侧相连，满足高度差阈值为约束条件，建立单目标0-1规划模型。算法为先提取任意块碎片边缘灰度值和高度，得到差异度矩阵，编程将中文碎片按高度分为18类，人工干预分为11行，再利用问题一中碎片纵向复原方法，得到中文复原序号，画出中文复原图片。（英文复原模型相似，仅高度差阈值不同）针对问题三，对于双面英文碎片的复原问题，我们提出了单词残缺程度的定义，定量的描述了英文碎片的特征信息，构成了算法的核心内容，运用编程和人工干预将碎纸片分为11类，每类19个碎片，在此基础上利用前两问所建的0-1规划模型，再加上双面的一些约束条件，得到双面英文复原序号，并绘出英文双面复原图片。关键词：差异度指数；0-1规划；LINGO软件；聚类分析；高度差；残缺程度；

碎纸片的拼接复原.

碎纸片的拼接复原摘要本文利用MATLAB软件将附件图像数字化，把图像转化为灰度矩阵进行处理。问题一，本文利用边缘匹配模型和灰度匹配模型对碎纸片的边缘作分析。基于，边缘部分的黑白分布越相近，两者相连的可能性越高的原理，得到附件1的排序是008，014，012，015，013，010，002，016，001，004，005，009，013，018，011，007，017，000，006 。附件2的排序是003，006，002，007，015，018，011，000，005，001，009，013，010，008，012，014，017，016，004。问题二，本文首先按行将小块进行分类，以简化模型。在附件3中，将碎纸片分组，对分完组后的碎纸片采用字体矩形模型，实现同行间排序，将得到的行再通过匹配模型，从而拼出原文。而对于附件4，本文建立四线格位置模型，将碎纸片进行分组。计算过程中发现部分标号基线相同，但却与不同的行对应匹配，此时进行人工干涉。然后运用行内匹配模型，对同行间的碎纸片排序。附件3、附件4的排序结果见附录一。关键词：灰度矩阵，匹配模型,相关性分析,三线格基线,人工干涉,最优化

一.问题重述破碎文件的拼接一直以来都以人工为主，其准确度较高，但效率较为低下，不能承担短时间内完成巨大数量的碎片拼接任务，遏制了在司法物证复原、历史文献修复以及军事情报获取等领域的进一步发展。随着计算机技术的发展，我们尝试运用计算机软件来实现对破碎文件的迅速拼接。现问题如下：（1）、对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。（2）、对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果表达要求同上。说明：附件1、附件2为纵切碎片数据，每页纸被切为19条碎片。附件3、附件4为纵横切碎片数据，每页纸被切为11×19个碎片。其中每一附件为同一页纸的碎片数据。二.模型假设 1.附件中所给的拼接碎纸片毫无缺失。 2.附件中的英文严格按照四线格方式打印。 3.机器印刷时的字间距和行间距大致相同。 4.碎纸机切割图片是垂直的。 5.碎纸机切割的碎纸片大小相同、质地均匀。 6.所有的碎纸片由同一碎纸机切割。 7.每个附件中所有的碎纸片来自于同一页文字文件。三．符号说明符号符号说明 ,R r相关系数 M灰度矩阵 Y碎纸片左边缘矩阵 1 Y碎纸片右边缘矩阵 2 ai编号为i的碎纸片，第j行k列的灰度值 ,j k (), R u v相关系数四．问题分析碎纸片拼接技术是模式识别领域中一个较为新颖但很典型的应用。他涉及到数字图

碎纸片的拼接复原分析模型完整版

碎纸片的拼接复原分析模型 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

碎纸片拼接复原的设计与实现摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。由于人工拼接效率较低，我们利用MATLAB 软件编写程序，实现碎纸片拼接技术的计算机化，实现批量拼接，以节省人力和时间。（一）为寻找最吻合拼接方案，利用MATLAB 软件中的imread 函数，实现了碎纸片与矩阵之间的形式转化以便于碎纸图片的拼接比对。数值0至255表示图中某一像素点由黑到白的变化程度。再根据纸张的边界留白较多，通过计算每个矩阵第一列中各向量的元素和，可将所得和数值最大的列向量所在矩阵对应的碎纸片确定为左边界。经计算知：008图为整体图片的左边界。根据使吻合参数 1980 ,,72,11 {}{}i j k k k P i P j ρ==-∑最小的原则，可计算出下一张图片。重复此步骤，以此类推，每次都挑选出剩余图片中与前一幅图片吻合参数,i j ρ最小的作为与之相连接的碎纸图片。最后可得到来进行优化。附件3类比于问题一，用相同的方法找到所有碎纸片的左边界，共11 一行作为入手点，利用MATLAB 软件进行图片拼接。但由于碎纸图片的行特征值有误差，故图片大块拼接正确，但与实际情况有细微差别。通过简单的人工检测得到准确行的排列顺序，由于行信息充足，借用第一问最终达到正确拼接效果。结果矩阵如表12 所示。第二种情况的关键点是找出准确的行特征，由于汉字与英文书写格式不同，汉字均为方块字，易于定位。而英文由于特殊的书写方式，上下位置不同，不易于找到行特征值。如：英文字母最为密集行中点位置。需将附件4图片对应的矩阵转化为0-1列向量（空白行为0，反之则为1）。利用此方法筛选出位于同一行的碎纸片并进行纸片拼接。后续拼接方法同附件3。结果矩阵如表13 所示。（三）结合双面信息处理边界，得到边界特点。根据元音字母中心位置得出行高，从而更准确筛选同行图片。双面信息同时校准，更容易得到拼接顺序，人工干预少。结果矩阵如表5 所示。模型一简单易处理，适用于含大量信息的碎纸片拼接且准确度高；模型二针对文字内容的中英文差异分别利用吻合参数和行高作为标准来筛选图片；模型三深入生活实际，考虑日常生活中反正面印刷情况并结合英文印刷特点，实用性高，双面信息同时校准，人工干预少。