Pandoc是一款功能强大的开源文档转换工具,既可以运行于 Windows 平台,也可以在 macOS、Linux 平台运行。John MacFarlane 建立了其高效可扩展式的插件结构,已经被广泛应用于不同类型的文本 (Markdown, LaTeX, DOCX) 之间的各种格式的相互转换,在 #学术写作和文档迁移多个格式方面被广泛使用。
Pandoc:开源免费的文档转换工具,支持多种格式互转
核心功能与优势
-
多格式无缝转换
- 超过 60 中不同类型的内容格式,包括:Markdown、LaTeX、HTML 和 DOCX、EPUB、jupyter notebook、PDF 等和输出格式超过 70 种不同种类的文件与内容形式转换,包括 PDF、EPUB3、Word, Reveal.js 幻灯片或者简单的 TXT 文本文件等不同格式转化
- 将一个 LaTeX 写的论文变成电子书 EPUB 或者将 CSV 批量转化一次;将一篇本地博主写好的 markdown 博客页面变成 WP 博客可以发上去的 HTML 页面等等。
-
Markdown 增强与扩展
- 被冠以「Markdown 瑞士军刀」的 Pandoc 更是对原生语法做了扩展,加入了对表格、脚注、LaTeX 公式和引文的支持。
-
模块化与可编程性
- 通过读取器(Readers)解析输入格式 AST,由写入器(Writers)输出转化后的格式。
- Lua 过滤器来自自由地更改 AST,并创建自己的数据调整方法(批量修改编码、获取某些东西等)。
-
跨平台与便捷安装
- 兼容 Linux、macOS、Windows,可通过二进制包、包管理器(如 Homebrew、Chocolatey)或源码快速安装。
应用场景
- 文档格式迁移:例如将学术论文(LaTeX)转换为 EPUB 电子书,或把 MediaWiki 内容转为 Markdown。
- 技术写作与出版:结合 Markdown 编写技术文档,生成 PDF、HTML 或 DOCX 版本。
- 数据与演示处理:将 CSV/TSV 表格转换为其他格式,或制作成 Reveal.js、Slidy 幻灯片。
- 开发与协作:作为一个开源项目,支持在 GitHub 上提交代码、反馈 Bug 和 Feature。
Pandoc安装与操作使用教程
一、安装
- 官网:下载安装包(支持 Windows/macOS/Linux)。
- 验证:终端输入 pandoc –version,显示版本号即安装成功。
二、核心命令
pandoc [输入文件] -o [输出文件] # 自动识别格式转换
示例:
- Markdown → PDF:pandoc doc.md -o doc.pdf(需提前安装 LaTeX)。
- HTML → Word:pandoc page.html -o report.docx。
- 纯文本 → Markdown:pandoc text.txt -o content.md。
三、常用选项
- 指定格式:–from=html –to=markdown(简化:-f html -t markdown)。
- 添加元数据:-M title=”文档标题” -M author=”作者”。
- 数学公式渲染:–mathjax(用于 HTML 输出)。
- 应用 CSS:–css=style.css(仅 HTML 有效)。
四、进阶技巧
1、批量转换:
pandoc *.md -o report.pdf # 合并多个 Markdown 为 PDF
2、过滤器(Lua/Python):
- 安装插件:pandoc -F pandoc-citeproc(文献引用处理)。
- 自定义脚本:–lua-filter=script.lua(修改文档结构)。
3、模板定制:
pandoc input.md –template=custom-template.tex -o output.pdf # 自定义 LaTeX 模板
资源与社区
- 官方文档:https://pandoc.org/MANUAL.html
- GitHub 仓库:https://github.com/jgm/pandoc
- 社区论坛:https://talk.commonmark.org/c/pandoc