办公

当前位置:永利皇宫463登录 > 办公 > excel表格怎么设置打印格式,扫描件的PDF表格如何

excel表格怎么设置打印格式,扫描件的PDF表格如何

来源:http://www.makebuLuo.com 作者:永利皇宫463登录 时间:2019-11-08 22:11

回答:扫描件的PDF与PDF表格是不同的概念的,是不一样的,扫描件到电脑上是图片形式,扫描件的PDF表格,提取出来也是图片形式。谢谢

一、对打印文档的页面设置

这里是打印页面的总设置,很多时候打印不正常,问题都出现在这里。

永利皇宫463登录 1

主要介绍三个:

永利皇宫463登录 2

回答:目前没有完美的方法。可以试试看ayybb fine reader,对表格识别较好,但中文识别率还是只有70-80%,英文识别率会高很多。

03 错误单元格打印

永利皇宫463登录 3

2、需要检索图片名列。然后检测文件夹里面是否有对应的图片。
同时把图片提取首字母并生成新文件名
比如
功夫熊猫.jpg 会变成 tv_gfxm.jpg
必备古诗.jpg 会变成 mv_gfxm.jpg

回答:微信-小程序-搜索-图文传字

在评论区留言,告诉小编,你想学习哪些Excel技巧?

永利皇宫463登录 4

后台回复关键词:转发,获取Excel练习资料

关于作者

专注分享Excel经验技巧

一个人走得快,一群人走得远,与110位同学共同成长

训练营期待你的加入

永利皇宫463登录 5

回答:

打印设置,说简单很简单,但如果不清楚功能设置,也会很费劲,特别是着急打印的时候。

希望看完我的介绍,能帮你全面了解打印的功能设置。

永利皇宫463登录 6

回答:首选是人工转换,pdf365.cn/smart

06 打印居中显示

永利皇宫463登录 7

开发那边的需求

点击“PDF转Excel”,上传文档,点击“开始转换”即可

打印批注

批注的打印可以在工作表末尾,也可以如工作表显示打印。 步骤:----选择或者。永利皇宫463登录 8

回答:


问题:扫描件的PDF表格如何提取成excel表格的格式?

打印页码

EXCEL的页面虽然平时看不到,但打印时就可以显示。 步骤:1、--,选择需要的页眉页脚格式,也可以自定义页眉页脚。

2、点击可以看到表格显示页码。永利皇宫463登录 9

永利皇宫463登录 10

扫描扫描件,提取文字。

打印为一页

表格要求打印为一页,不用调整表格,可以在打印时进行设置。 步骤:---。永利皇宫463登录 11

永利皇宫463登录 12

回答:Adobe acrobat dc可以完美解决,导出为Excel表格

三、打印预览设置

功能页码如下:

永利皇宫463登录 13

常用的功能有:打印页数,横向打印或纵向打印,还有纸张的选择等等。

详细介绍两个:

永利皇宫463登录 14

永利皇宫463登录 15

3、打印标题

打印标题是将选择的行区域或列区域作为标题,打印的每一页都会带着。

永利皇宫463登录 16

打印预览效果:

永利皇宫463登录 17

设置的行标题在第二页中也会显示。

  

但无论怎么样,都很难做到表格一起提取,只能自己编辑表格后再复制进提取的文字。

4、页眉页脚

常在页眉中显示文件标题,在页脚中设置页码

永利皇宫463登录 18

永利皇宫463登录 19

或是用电脑下载个如汉文ocr识别软件,提取文字。

问题:永利皇宫463登录,excel表格怎么设置打印格式?

功能实现

永利皇宫463登录 20

二、页面设置

在打印标题中可以打开页面设置窗口,在打印预览中也可以打开:

永利皇宫463登录 21

介绍几个主要的功能:

下面是最终效果图
这是单个mv的数据和字段

有时候大家对于人工转换会有些误解,以为人工确定是速度很慢,收费很贵那种,其实不然。正常十几页的文档,一页文档仅需要几毛钱,对于机器肯定是贵了些,但是我们都知道一个道理:一分价钱一分货,如果花很低的价钱想要体验到很好的服务,那是不可能的。

2、分页符

在Excel中是自带分页符的,在分页预览页面可以查看:

永利皇宫463登录 22

上图中的蓝色虚线即为自动分页符,是上一页和下一页的分界线,Excel自动识别的。

手动设置分页符的操作如下:

单击需要插入分页符的下面一个单元格,然后页面布局——分隔符——插入分页符

永利皇宫463登录 23

手动插入分页符是蓝色的实线。

调整分页符,直接用鼠标上下拖动即可。自带和设置的分页符都可进行拖动。

永利皇宫463登录 24

永利皇宫463登录 25

回答:没有做过,也没有经验,抱歉!

四、打印机属性

这个是完全根据打印机来的,不同的打印机设置也不同,一般有打印方式(单双面等)、打印纸尺寸和打印颜色等方面。

永利皇宫463登录 26

以上几点都熟悉了,相信你可以处理打印中的各种问题了。

1、功夫熊猫以及阿狸布塔故事集都是属于剧集的。意思就是有很多集,这里称他们为tv
最下面这几行第一列没名字的都是单集的,这里称它们为mv
需要统计所有工作表里面的数据把tv放一个大的json里面
把mv放一个大的json里面

回答:题主可以采取PDF转Excel的方法,来提取Excel中的表格,当然了,你可以去这各平台实现在线PDF文档转换:

2、是否可以网格线

永利皇宫463登录 27

永利皇宫463登录 28

05 网格打印

永利皇宫463登录 29

下面是一个tv

2、缩放打印

可直接缩放为一页,

永利皇宫463登录 30

也可以自定义缩放,按照设置比列缩放打印

永利皇宫463登录 31

把使用说明告诉开发即可

打印标题

打印多页表格时,打印预览只有第一页有标题,进行设置就可以将全部页面都打印标题。 步骤:1、--,选中标题行所在单元格;

2、点击可看到所有页面都有标题栏。永利皇宫463登录 32

永利皇宫463登录 33

04 单色打印

永利皇宫463登录 34

# -*- coding: utf-8 -*-import xlrdimport uuidimport re,time,json,shutil,os#临时存放所有单集mv_list=[]#临时存放剧集,后面调用format_tv方法存成tv_dicttv_list=[]#tv_dict是所有剧集,key是首字母缩写,值是列表,列表每个元素是剧集的一行tv_dict={}#图片集合,后期用来给图片重命名使用pic_list=[]exec_log=open('执行日志.log','a',encoding='utf-8')# 追加模式error_log=open('错误日志.log','a',encoding='utf-8')# 追加模式#获取excel表中需要提取的视频文件名列表,返回值是个excel句柄def OpenExcel(excel_file):    try:        dataHandle = xlrd.open_workbook(excel_file)        return dataHandle    except Exception as ex:        print        error_log.write('打开excel表失败,可能---'+excel_file+'---并不存在n')        error_log.close()        exit#读取excel数据def ReadExcel(excel_file):    workbook=OpenExcel(excel_file)    exec_log.write("正在读取excel表内容")    print('打印所有sheet:', workbook.sheet_names    #工作表个数    sheet_name_list=workbook.sheet_names()    sheet_count=len(workbook.sheet_names    print("excel表sheet个数:",sheet_count)    exec_log.write("准备循环excel每个工作表..n")    for i in range(sheet_count):        current_sheet = workbook.sheet_by_index  # sheet索引从0开始        rows_num = current_sheet.nrows        cols_num = current_sheet.ncols        print("当前sheet的名字是:%s  行数:%s   列数:%s:"%(sheet_name_list[i],rows_num,cols_num))        print("#####################################################")        for r in range(1,rows_num):            # 一行数据的实体            entity_dict = {}            for c in range(0,cols_num):                cell_value=get_value_and_get_int(current_sheet,r,c)                #这里如果单元格内容为空或者是None的话,再次判断是是否属于合并单元格                if (cell_value is None or cell_value == ''):                    cell_value = (get_merged_cells_value(current_sheet, r, c))                the_key = 'colnum' + str                entity_dict[the_key] = cell_value            #第7列判断是否有空格            if entity_dict["colnum7"] is None or entity_dict['colnum7'] == '':                error_log.write("遇到图片所在列为空值的情况,无法对空值处理,格式异常位置为,3秒后退出n")                exec_log.write("当前sheet的名字是:%s  行数:%s "%(sheet_name_list[i],r))                exec_log.close()                print("遇到图片所在列为空值的情况,无法对空值处理,格式异常位置为,3秒后退出")                print("当前sheet的名字是:%s  行数:%s "%(sheet_name_list[i],r))                time.sleep                exit            #第7列去掉空格,因为要把图片转成首字母            entity_dict["colnum7"].replace            if entity_dict['colnum1'] is None or entity_dict['colnum1'] == '':                mv_list.append(entity_dict)            else:                tv_list.append(entity_dict)    exec_log.write("循环所有工作表完毕,已经追加到单集列表和剧集列表..暂未生成图片列n")#处理单元格值中的int类型,因为xlrd模块会把int自动转成了float,再改回去def get_value_and_get_int(sheet,r,c):    cell_value = sheet.row_values[c]    # 这由于xlrd会把int类型自动转存float,这里做一个处理,把它再转回int类型    cell_type = sheet.cell.ctype  # 表格的数据类型    if cell_type == 2 and cell_value % 1 == 0.0:  # ctype为2且为浮点        cell_value = int(cell_value)  # 浮点转成整型    return cell_value#找到所有合并单元格的坐标def get_merged_cells:    """    获取所有的合并单元格,格式如下:    [(4, 5, 2, 4), (5, 6, 2, 4), (1, 4, 3, 4)]    (4, 5, 2, 4) 的含义为:行 从下标4开始,到下标5  列 从下标2开始,到下标4,为合并单元格    :param sheet:    :return:    """    return sheet.merged_cells# 获取单元格的值def get_merged_cells_value(sheet, row_index, col_index):    """    先判断给定的单元格,是否属于合并单元格;    如果是合并单元格,就返回合并单元格的内容    :return:    """    merged = get_merged_cells    for (rlow, rhigh, clow, chigh) in merged:        if (row_index >= rlow and row_index < rhigh) and (col_index >= clow and col_index < chigh) :            cell_value = sheet.cell_value(rlow, clow)            # print('该单元格[%d,%d]属于合并单元格,值为[%s]' % (row_index, col_index, cell_value))            return cell_value            # print(cell_value)    # return Nonedef getUUID():    return uuid.uuid1().hex#去除标点符号def remove_punctuation:    new_str=re.sub('[^wu4e00-u9fff]+', '',str)    return new_str#获取单个汉字的首字母def single_get_first:    str1 = unicode1.encode    try:        ord        return str1    except:        asc = str1[0] * 256 + str1[1] - 65536        if asc >= -20319 and asc <= -20284:            return 'a'        if asc >= -20283 and asc <= -19776:            return 'b'        if asc >= -19775 and asc <= -19219:            return 'c'        if asc >= -19218 and asc <= -18711:            return 'd'        if asc >= -18710 and asc <= -18527:            return 'e'        if asc >= -18526 and asc <= -18240:            return 'f'        if asc >= -18239 and asc <= -17923:            return 'g'        if asc >= -17922 and asc <= -17418:            return 'h'        if asc >= -17417 and asc <= -16475:            return 'j'        if asc >= -16474 and asc <= -16213:            return 'k'        if asc >= -16212 and asc <= -15641:            return 'l'        if asc >= -15640 and asc <= -15166:            return 'm'        if asc >= -15165 and asc <= -14923:            return 'n'        if asc >= -14922 and asc <= -14915:            return 'o'        if asc >= -14914 and asc <= -14631:            return 'p'        if asc >= -14630 and asc <= -14150:            return 'q'        if asc >= -14149 and asc <= -14091:            return 'r'        if asc >= -14090 and asc <= -13119:            return 's'        if asc >= -13118 and asc <= -12839:            return 't'        if asc >= -12838 and asc <= -12557:            return 'w'        if asc >= -12556 and asc <= -11848:            return 'x'        if asc >= -11847 and asc <= -11056:            return 'y'        if asc >= -11055 and asc <= -10247:            return 'z'        return ''#获取每个汉字每个首字母并返回英文首字母字符串def getPinyin:    if str==None:        return None    str_list = list    charLst = []    for item in str_list:        charLst.append(single_get_first    return  ''.join#拷贝文件def copy_file(source_file,target_file):    if os.path.exists(source_file) and not os.path.exists(target_file):        shutil.copy(source_file,target_file)    else:        error_log.write("下面路径文件不存在: %sn"%(source_file))        print("下面路径文件不存在: %s"%(source_file))        time.sleep#处理图片列表[[pic1,tar1],[pic2,tar2],去重并且调用拷贝文件方式拷贝为新文件def copy_file_from_list:    #对列表去重,这里无法使用set,因为set无法对子元素为列表的元素做hash    new_pic_list=[]    for item in pic_list:        if item not in new_pic_list:           new_pic_list.append    for item in new_pic_list:        copy_file(item[0],item[1])#给单集新增加一列key,值是图片列的英文首字母加上路径名拼接字符串,比如"excel_pic_dir/mv_hj.jpg" 这种格式def add_pic_col_for_mv:    exec_log.write("给单集列表生成图片路径列excel_pic_dir/mv_hj.jpg 这种格式n")    for item in mv_list:        #格式化汉字字符串,去掉特殊符号        temp_str=remove_punctuation(item['colnum7'])        #获取首字母字符串        temp_letter=getPinyin        # print(item['colnum7'])        # temp_letter=getPinyin(temp_letter)        # temp_letter=getPinyin(item['colnum7'])        # print(temp_letter)        #拼接为图片路径,一个放到图片集合中给后面重命名使用,一份直接增加到excel行字典中        source_file="excel_pic_dir/"+temp_str+".jpg"        target_file="excel_pic_dir/mv_"+temp_letter+".jpg"        pic_list.append([source_file,target_file])        # copy_file(source_file,target_file)        item["pic_path"]=target_file    exec_log.write("给单集列表生成图片路径列完毕n")#给剧集新增加一列key,值是图片列的英文首字母加上路径名拼接字符串,比如"excel_pic_dir/tv_hj.jpg" 这种格式def add_pic_col_for_tv:    exec_log.write("给剧集列表生成图片路径列excel_pic_dir/mv_hj.jpg 这种格式n")    for item in tv_list:        #格式化汉字字符串,去掉特殊符号        temp_str=remove_punctuation(item['colnum7'])        #获取首字母字符串        temp_letter=getPinyin        #拼接为图片路径        source_file="excel_pic_dir/"+temp_str+".jpg"        target_file="excel_pic_dir/tv_"+temp_letter+".jpg"        #拼接为图片路径,一个放到图片集合中给后面重命名使用,一份直接增加到excel行字典中        pic_list.append([source_file,target_file])        # copy_file(source_file,target_file)        # temp_path="excel_pic_dir/tv_"+temp_letter+".jpg"        item["pic_path"]=target_file    exec_log.write("给剧集列表生成图片路径列完毕n")#把剧集的都放在一个字典中,key是剧集首字母,value是剧集列表def format_tv:    # tv_dict={}    exec_log.write("把剧集的都放在一个大字典中,key是剧集首字母,value是剧集列表n")    for tv_item in tv_list:        #先获取字符串,去掉标点符号        temp_str=remove_punctuation(tv_item['colnum1'])        #获取首字母字符串        temp_key=getPinyin        if temp_key in tv_dict:            tv_dict[temp_key].append        else:            tv_dict[temp_key]=[]            tv_dict[temp_key].append    exec_log.write("把剧集的都放在一个大字典中完毕n")if __name__ == "__main__":    ReadExcel("001.xlsx")    # print(mv_list[0])    add_pic_col_for_mv    add_pic_col_for_tv    format_tv    copy_file_from_list    print("单集个数:",len    print("剧集套数:",len# print(mv_list[0])# for k,v in tv_dict.items():#     print#     break#获取单集最终字典列表programMovieList=[]for item in mv_list:    new_item={}    new_item["programName"]=item["colnum3"]    new_item["programYear"]=""    new_item["programType"]=""    new_item["programDirector"]=""    new_item["programActor"]=""    new_item["programPoster"]=item["pic_path"]    new_item["programIntroduce"]=item["colnum5"]    new_item["sitnum"]=0    new_item["code"]=item["colnum2"]    new_item["cpCode"]=item["colnum6"]    programMovieList.appendexec_log.write("单集最终字典列表获取完毕n")exec_log.write("开始dump---单集---数据到json文件中n")with open('mv.json', 'w',encoding='utf-8') as f_mv:    json.dump(programMovieList, f_mv,ensure_ascii=False,sort_keys=True, indent=4)exec_log.write("dump---单集---数据完毕n")print("dump---单集---数据完毕..")time.sleepdef get_seriesList(item_list):    seriesList=[]    for item in item_list:        new_item={}        new_item["programName"]=item["colnum3"]        new_item["code"]=item["colnum2"]        seriesList.append    return seriesList#获取剧集最终字典列表programTvList=[]for item in tv_dict:    new_item={}    # print    new_item["programName"]=tv_dict[item][0]["colnum1"]    new_item["programYear"]=""    new_item["programType"]=""    new_item["programDirector"]=""    new_item["programActor"]=""    new_item["programPoster"]=tv_dict[item][0]["pic_path"]    new_item["programIntroduce"]=tv_dict[item][0]["colnum5"]    new_item["sitnum"]=len(tv_dict[item])    new_item["cpCode"]=tv_dict[item][0]["colnum6"]    new_item["recommend"]=""    new_item["seriesList"]=get_seriesList(tv_dict[item])    programTvList.append    # for k,v in new_item.items():    #     print("""+k+""",v)#indent参数是缩进的意思,它可以使得数据存储的格式变得更加优雅。    # with open('data.json', 'w',encoding='utf-8') as f:    #     json.dump(new_item, f,sort_keys=True, indent=4)exec_log.write("开始dump---剧集---数据到json文件中n")with open('tv.json', 'w',encoding='utf-8') as f_tv:    json.dump(programTvList, f_tv,ensure_ascii=False,sort_keys=True, indent=4)exec_log.write("dump---剧集---数据完毕n")print("dump---剧集---数据完毕..")print("程序执行完毕,2秒后退出..")error_log.close()exec_log.close()time.sleep

02 一页纸打印

永利皇宫463登录 35

永利皇宫463登录 36

3、错误单元格打印效果

永利皇宫463登录 37

永利皇宫463登录 38


1、页边距

点击右下角按钮,就可以显示边距线,可以直接拖动调整,非常方便。

永利皇宫463登录 39

永利皇宫463登录 40

1、打印区域

顾名思义,这里设置的是要打印的区域,选中要打印的区域后,点击设置打印区域命令即可,其他未选择区域则不会打印。

永利皇宫463登录 41

我将前几行设置为打印区域,看一下打印预览:

永利皇宫463登录 42

后面的未设置的区域都不会打印。

永利皇宫463登录 43

01 打印标题页

永利皇宫463登录 44

最后打包成exe交给开发那边

1、居中设置:

永利皇宫463登录 45

永利皇宫463登录 46

回答:

这里没使用到uuid。本来想把它当做一个key的。后面发现不需要

指定区域打印

EXCEL打印不用整个表格都打印下来,可以只选取需要打印的区域。 步骤:---,鼠标选中需要打印的区域。

永利皇宫463登录 47

运行结果

连Excel打印都不会,怎么敢说话!

永利皇宫463登录 48

本文由永利皇宫463登录发布于办公,转载请注明出处:excel表格怎么设置打印格式,扫描件的PDF表格如何

关键词:

上一篇:没有了

下一篇:没有了