本文先来分享Python实现自动化办公需要学什么,从哪里学!以及自动化办公技巧的资源整理…
很多非IT职场人,想要把Python用到工作中,却不知道如何下手。其实自动化办公无非就是Excel、PPT、Word、邮件、文件处理、数据分析处理、爬虫这些,我们先了解Python自动化办公的知识点:
-
python基础
-
excel自动化
-
ppt自动化
-
word自动化
-
邮件处理
-
文件批量处理
-
数据处理与分析
-
自动化爬虫
一、Python基础
想要通过Python来自动化办公,那么肯定是要先熟悉基础语法,大家可以对照文档学习,也可以看相关基础课程。重点是在学习基础语法的时候,需要不断的上手练习。
| 语法 | 主要内容 |
|---|---|
| 基本数据类型 |
不可变数据(3个)Number、String、Tuple; 可变数据(3个)List、Dictionary、Set |
| 运算符 | 算数运算符、逻辑运算符、赋值运算符、比较运算符、位运算符… |
| 条件控制语句 | if…elif…else语句 |
| 循环语句 | while语句、for语句 |
| 函数 | def定义函数、函数调用、参数传递、匿名函数… |
| 迭代 | 迭代过程、迭代器、生成器、生成器表达式 |
| 文件操作 | open()函数、read、readline、readlines、write…方法 |
| os模块 | 处理系统文件和目录 |
| 模块 | 模块导入、常用标准模块、常用第三方库 |
| 错误和异常 | try/except语句 |
| 面向对象 | 简单掌握面向对象概念即可 |
课程推荐:
课程相关笔记分享:
Python学习的简易步骤:找到目标 —> 了解Python —> 知道变量/算法/解释器 —> 数据类型 —> 列表和元祖 —> 字符串 —> 字典 —> 循环 —> 面向对象 —> 项目实战;
Python从变量到数据类型
/
输出格式大全!代码都可复制
基础学习输入
/
转换数据类型的函数
/
算数、赋值、复合赋值、比较、逻辑运算符
条件语句边学边练,习题均有答案
/
while的语法和应用
/
while循环嵌套以及练习题
字符串
/
Python列表的常用操作
/
元祖
/
集合
/
公共操作
推导式学习
/
函数
/
函数
/
文件的基本操作汇总(上)
/
基本操作汇总(下)
面向对象基础篇
/
面向对象之魔法方法
/
面向对象实际案例:烤地瓜和搬家具
继承
/
面向对象的三大特征
/
异常学习
/
模块
/
包
/
面向对象版学员管理系统
二、Excel自动化
Python针对Excel有很多第三方的库可以用,下面给大家介绍一些:
-
Openpyxl:
这个库是一个用于读取和写入Excel文件(扩展名为.xlsx的文件)的库。它支持Excel 2010及更高版本的文件格式。Openpyxl是目前使用较多的库之一。 -
XlsxWriter:
这是一个用于创建Excel文件的库。它允许你创建带有图表、图像和公式的复杂Excel文档。但是,它不支持读取已有的Excel文件。 -
xlrd 和 xlwt:
这两个库分别用于读取和写入Excel文件(扩展名为.xls的文件)。它们支持Excel 97-2003格式的文件。这两个库的功能有限,但在处理旧版Excel文件时可能会有用。 -
Pandas:
这个库主要用于数据分析和处理,但它也可以读取和写入Excel文件。Pandas可以与Openpyxl、XlsxWriter、xlrd和xlwt一起使用,使得在Python中处理Excel变得更加方便。
想要实现表格自动化,首先我们要了解Excel相关概念,比如工作簿、工作表、单元格、数据类型等。学习所选的库的用法,其实也就是安装、基本操作(读取、写入、格式化、单元格等)、高级功能(公式、图表等等)。
想要学习这些库,可以直接看官方文档。
-
Openpyxl: 官方文档(英文):
https://openpyxl.readthedocs.io/en/stable/
-
XlsxWriter: 官方文档(英文):
https://xlsxwriter.readthedocs.io/
-
xlrd官方文档(英文):
https://xlrd.readthedocs.io/en/latest/
-
xlwt官方文档(英文):
https://xlwt.readthedocs.io/en/latest/
-
Pandas: 官方文档(英文):
https://pandas.pydata.org/pandas-docs/stable/index.html
如果大家对自动化办公非常有兴趣,也可以买一本专门的教材来看。
三、PPT自动化
在Python中,有一个库可以帮助大家实现PPT自动化,叫【python-pptx】。它可以用来读取和创建PPT文件,也可以让你使用Python轻松地创建和修改PPT文档,包括创建幻灯片、添加文本框、图形、图片等。
想要学会PPT自动化,大家需要
学习Python基础知识:
了解基本的数据结构、控制流程和函数等
学习PPt相关概念:
了解幻灯片、布局、占位符、形状等;
学习python-pptx库的用法:
熟悉库的安装、基本操作(如创建幻灯片、添加文本框等)和高级功能(如图形、图片等)
要学习python-pptx库,可以从以下途径开始:
官方文档(英文):
https://python-pptx.readthedocs.io/en/latest/index.html
四、Word自动化
在Python中,有一个库可以帮助我们实现Word自动化,它叫做python-docx。python-docx可以用来读取和创建Word(.docx格式)文件。它可以让你使用Python轻松地创建和修改Word文档,包括添加段落、表格、图片等。
要学会word自动化,需要:
- 学习Word相关概念:了解文档结构、段落、样式等。
- 学习python-docx库的用法:熟悉库的安装、基本操作(如创建文档、添加段落等)和高级功能(如表格、图片等)。
学习python-docx库,可以从以下途径开始:
官方文档(英文):
https://python-docx.readthedocs.io/en/latest/index.html
五、文件批量处理
文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等等重复性操作。如果一个个手工操作,那真的心累。
python在处理批量操作有得天独厚的优势,成千上万的文件修改可能只需几秒的时间。
os是python文件操作的库,可以实现对电脑上文件的增删改查。
| 方法 | 作用 |
|---|---|
| os.chdir(path) | 改变当前工作目录 |
| os.getcwd() | 返回当前工作目录 |
| os.listdir() | 返回path指定的文件夹包含的文件或文件夹的名字的列表 |
| os.makedirs(path[, mode]) | 创建一个名为path的文件夹 |
| os.remove(path) | 删除路径为path的文件 |
| … | … |
六、数据处理和分析
数据处理的库主要有:pandas、numpy、matplotlib、sklearn…
pandas是一款不断进步的python数据科学库,它的数据结构十分适合做数据处理,并且pandas纳入了大量分析函数方法,以及常用统计学模型、可视化处理。
如果你使用python做数据分析,在数据预处理的过程,几乎九成的工作需要使用pandas完成。
在一些企业招分析师的笔试题中,pandas已经作为必考的工具,所以如果你想要入行数据分析师,请努力学习使用pandas。
numpy是python的数值计算库,包括pandas之类的很多分析库都建立在numpy基础上。
numpy的核心功能包括:
- ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组
- 用于对整组数据进行快速运算的标准数学函数(无需编写循环)
- 用于读写磁盘数据的工具以及用于操作内存映射文件的工具
- 线性代数、随机数生成以及傅里叶变换功能
- 用于集成由C、C++、Fortran等语言编写的代码的A C API
numpy之于数值计算特别重要是因为它可以高效处理大数组的数据。这是因为:
- 比起Python的内置序列,numpy数组使用的内存更少
- numpy可以在整个数组上执行复杂的计算,而不需要Python的for循环
matplotlib和seaborn是python主要的可视化工具,建议大家都去学学,数据的展现和数据分析同样重要。
sklearn和keras,sklearn是python机器学库,涵盖了大部分机器学习模型。keras是深度学习库,它包含高效的数值库Theano和TensorFlow。
这里涉及到的知识点就非常多了,建议大家系统学习:
- 开发入门:Linux入门 → MySQL数据库
- 核心基础: Hadoop
- 数仓技术: Hive数仓项目
- PB内存计算: Python入门 → Python进阶→ pyspark框架 → Hive+Spark项目
黑马程序员Python:2023年Python+大数据学习路线图
【自动化爬虫】
【自动化资源】
社群机器人定时发送天气预报:hiflow.tencent.com/template/details/1529732135060897793/schedule-juhe-api/
自动识别发票信息并写入:hiflow.tencent.com/template/details/1460452873764175873/vika-tencent-invoice-ocr/
