JAVA常用API或编程工具003--实现pdf在线阅读功能之pdf.js-白红宇的个人博客

发布日期：2021-06-29 17:57:50 浏览次数：2 分类：技术文章

本文共 3555 字，大约阅读时间需要 11 分钟。

pdf.js简介

PDF.js 是基于开放的及技术实现的开源产品。简单说就是一个 PDF 解析器。运用HTML5JavaScript（即pdf.js仅使用安全的web语言，不包含任何攻击者可以用的本地代码块）的PDF阅读器pdf.js，直接在标准的HTML页面上载入和渲染PDF文件, 还可以提高安全性（不需要安装第三方插件，安全性由浏览器保证），浏览器所做的安全措施已经为pdf.js提供了安全的运行环境。其对IE和 FireFox浏览器的要求是IE9+, FireFox19+。

在线示例：，

源码：

官网：

pdf.js VS 传统浏览器读取pdf

一般來說，PDF档案格式都是在浏览器中由外挂程式來描绘，通常是Adobe自己的PDF reader或來自其他供应商的描绘工具，但這些外挂通常无法充分运用PDF的特点，而且由于含有大量的受信任代码，使得Google Chrome浏览器必须运用SandBox沙箱原理，來检查PDF描绘工具是否遭到未知病毒感染。

使用adobe，必须在本地安装软件才能使用，而pdf.js不依赖环境、渲染速度快（过，确实很快）、安全性高。

pdf.js渲染PDF文件

pdf.js渲染PDF文件的流程：Fetch pdf (url / buffer) ——> canvas ——> 渲染

如果要深入pdf的渲染，需要去研究pdf.js源代码。pdf.js可通过pdf文件的地址或pdf数据流获取pdf，具体实现是调用接口函数 PDFJs.getDoc(url/buffer)将pdf载入html，通过canvas处理, 然后渲染pdf文件。网上给出的都是通过url来获取pdf的例子，而我在做项目的时候，后台（）要求是发pdf的数据流给前台，前台接收pdf的buffer,然后通过pdf.js来渲染。当然最初尝试buffer出现了很多问题，具体问题总结如下：

1）如何通过$.ajax接收后台发给前台的buffer数据；

2）如何将buffer传给pdf.js来处理（这里我使用了viewer.js, 所以需要考虑的是如何将buffer传给viewer.js来处理）；

3）如何将pdf.js转换成pdf.js可以接收的buffer格式；

（对应问题解决见代码注释）

注：viewer.js是pdf.js的扩展，其将打印、翻页、缩放等功能进行了实现，且界面非常好看。也就是说如果你引入了viewer.js，pdf的渲染和渲染之后的功能界面都已经帮你实现了，你不用自己去写界面。

先从官网：下载代码，然后使用文件viewer.html , 我的html就是在viewer.html 的基础上修改的，下面我给出buffer的例子：

<!DOCTYPE html>

<head>

{% load static %}{% get_static_prefix as STATIC_URL %}

<link href="{

{STATIC_URL}}css/preview.css" rel="stylesheet" type="text/css" />

{STATIC_URL}}pdfjs/web/viewer.css"/>

{STATIC_URL}}pdfjs/web/compatibility.js"></script>

{STATIC_URL}}pdfjs/web/locale/locale.properties"/>

{STATIC_URL}}pdfjs/web/l10n.js"></script>

{STATIC_URL}}pdfjs/build/pdf.js"></script>

{STATIC_URL}}pdfjs/web/debugger.js"></script>

<script src="{

{STATIC_URL}}js/-1.8.3.js" type="text/javascript"></script>

//convertDataURIToBinary()

//不知道什么原因如果后台直接将pdf的数据流发给前台，得到的是乱码，将数据转换成 Uint8Array始终不成功

//所以就让后台将发送之前的数据流做了base64编码发给前台，前台再解码得到的数据就不是乱码了。

var BASE64_MARKER = ';base64,';

var preFileId = {

{mark}};

//viewer.js全局变量,传入buffer，回答问题2

var DEFAULT_URL

$(document).ready(function(){

$.ajax({

type:"post",

async: false,

//ajax接收pdf数据流，注意dataType值的设置是否有错，如果不指定，jQuery将自动根据HTTP包MIME信息返回

//responseXML或responseText . 回答问题1

contentType:"application/pdf;charset=utf-8",

url:"{% url netPan.File.views.browserFuf%}",

data:{

id: preFileId

success:function(data){

var pdfAsDataUri = data;

//如果引入了viewer.js , 处理方法

var pdfAsArray = convertDataURIToBinary(pdfAsDataUri);

DEFAULT_URL = pdfAsArray;

// 只引入了pdf.js, 未引入viewer.js，处理方法

// var pdfAsArray = convertDataURIToBinary(pdfAsDataUri);

// PDFJS.getDocument（pdfAsArray).then(); 自己写pdf的处理函数

}

});

function convertDataURIToBinary(dataURI) { //编码转换，回答问题3

var base64Index = dataURI.indexOf(BASE64_MARKER) + BASE64_MARKER.length;

var base64 = dataURI.substring(base64Index);

var raw = window.atob(base64);

var rawLength = raw.length;

//转换成pdf.js能直接解析的Uint8Array类型,见pdf.js-4068

var array = new Uint8Array(new ArrayBuffer(rawLength));

for(i = 0; i < rawLength; i++) {

array[i] = raw.charCodeAt(i);

}

return array;

}

</script>

{STATIC_URL}}pdfjs/web/viewer.js"></script>

</head>

<body>

省略内容

</body>

</html>

转载地址：https://credream.blog.csdn.net/article/details/71791017 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：JAVA面试要点002_Git中fetch和pull的区别

下一篇：java零碎要点001--深入理解JVM_Java的堆内存_栈内存_以及运行时数据区的作用

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

发表评论

最新留言

关于作者

推荐文章