大量のPDFファイルがあり、ページ設定がA4ではないものを発見したいのですが、どんな方法がありますか

Node.jsを使用してもPDFファイルのページ設定を確認することができます。以下は、Node.jsでの例です。

まず、pdf-libというライブラリを使用してPDFファイルを操作します。まだインストールしていない場合は、次のコマンドを使用してインストールしてください。

npm install pdf-lib

次に、以下のコードを使用してPDFファイルのページ設定を確認できます。

const { PDFDocument } = require('pdf-lib');
const fs = require('fs');

async function checkPageSettings(pdfPath) {
  const existingPdfBytes = await fs.promises.readFile(pdfPath);
  const pdfDoc = await PDFDocument.load(existingPdfBytes);

  for (let i = 0; i < pdfDoc.getPageCount(); i++) {
    const page = pdfDoc.getPage(i);
    const { width, height } = page.getSize();

    if (width !== 595 || height !== 842) {  // A4ページサイズの場合
      console.log(`ページ ${i + 1} の設定がA4ではありません。`);
    }
  }
}

// 使用例
checkPageSettings('example.pdf');

この例では、pdf-libを使用してPDFファイルをロードし、各ページのサイズを取得しています。その後、A4ページサイズ(幅595ポイント、高さ842ポイント)と比較して、異なる場合にメッセージを出力しています。

タイトルとURLをコピーしました