Merge pull request #201 from sunnydanu/feat(new-tool)--ocr-image

feat(new-tool):-ocr-image
sunnydanu · Nov 2, 2024 · 8c628b1 · 8c628b1
2 parents b57d406 + 474cfca
commit 8c628b1
Show file tree

Hide file tree

Showing 10 changed files with 873 additions and 27 deletions.
diff --git a/components.d.ts b/components.d.ts
@@ -183,6 +183,7 @@ declare module '@vue/runtime-core' {
     NTable: typeof import('naive-ui')['NTable']
     NTag: typeof import('naive-ui')['NTag']
     NumeronymGenerator: typeof import('./src/tools/numeronym-generator/numeronym-generator.vue')['default']
+    OcrImage: typeof import('./src/tools/ocr-image/ocr-image.vue')['default']
     OtpCodeGeneratorAndValidator: typeof import('./src/tools/otp-code-generator-and-validator/otp-code-generator-and-validator.vue')['default']
     PasswordStrengthAnalyser: typeof import('./src/tools/password-strength-analyser/password-strength-analyser.vue')['default']
     PdfSignatureChecker: typeof import('./src/tools/pdf-signature-checker/pdf-signature-checker.vue')['default']

diff --git a/package.json b/package.json
@@ -46,6 +46,7 @@
     "@tiptap/vue-3": "2.0.3",
     "@types/figlet": "^1.5.8",
     "@types/markdown-it": "^13.0.7",
+    "@types/pdfjs-dist": "^2.10.378",
     "@vicons/material": "^0.12.0",
     "@vicons/tabler": "^0.12.0",
     "@vueuse/core": "^10.3.0",
@@ -89,12 +90,15 @@
     "netmask": "^2.0.2",
     "node-forge": "^1.3.1",
     "oui-data": "^1.0.10",
+    "path2d-polyfill": "^3.0.1",
     "pdf-signature-reader": "^1.4.2",
+    "pdfjs-dist": "^4.0.379",
     "pinia": "^2.0.34",
     "plausible-tracker": "^0.3.8",
     "qrcode": "^1.5.1",
     "randexp": "^0.5.3",
     "sql-formatter": "^13.0.0",
+    "tesseract.js": "^5.0.4",
     "ua-parser-js": "^1.0.35",
     "ulid": "^2.3.0",
     "unicode-emoji-json": "^0.4.0",

diff --git a/pnpm-lock.yaml b/pnpm-lock.yaml
diff --git a/src/tools/index.ts b/src/tools/index.ts
@@ -14,6 +14,7 @@ import { tool as peerShare } from './peer-share';
 import { tool as asciiTextDrawer } from './ascii-text-drawer';
 import { tool as textToUnicode } from './text-to-unicode';
 import { tool as gzipConverter } from './gzip-converter';
+import { tool as ocrImage } from './ocr-image';
 import { tool as safelinkDecoder } from './safelink-decoder';
 import { tool as xmlToJson } from './xml-to-json';
 import { tool as jsonToXml } from './json-to-xml';
@@ -165,13 +166,7 @@ export const toolsByCategory: ToolCategory[] = [
   },
   {
     name: 'Images and videos',
-    components: [
-      qrCodeGenerator,
-      wifiQrCodeGenerator,
-      svgPlaceholderGenerator,
-      cameraRecorder,
-      imageResizer,
-    ],
+    components: [qrCodeGenerator, wifiQrCodeGenerator, svgPlaceholderGenerator, cameraRecorder, imageResizer, ocrImage],
   },
   {
     name: 'Development',
@@ -211,12 +206,7 @@ export const toolsByCategory: ToolCategory[] = [
   },
   {
     name: 'Measurement',
-    components: [
-      chronometer,
-      temperatureConverter,
-      benchmarkBuilder,
-      energyComputer,
-    ],
+    components: [chronometer, temperatureConverter, benchmarkBuilder, energyComputer],
   },
   {
     name: 'Text',
@@ -233,11 +223,7 @@ export const toolsByCategory: ToolCategory[] = [
   },
   {
     name: 'Data',
-    components: [
-      phoneParserAndFormatter,
-      ibanValidatorAndParser,
-      multiLinkDownloader,
-    ],
+    components: [phoneParserAndFormatter, ibanValidatorAndParser, multiLinkDownloader],
   },
 ];
 

diff --git a/src/tools/ocr-image/index.ts b/src/tools/ocr-image/index.ts
@@ -0,0 +1,12 @@
+import { Scan } from '@vicons/tabler';
+import { defineTool } from '../tool';
+
+export const tool = defineTool({
+  name: 'OCRize image and PDF',
+  path: '/ocr-image',
+  description: 'Perform OCR (Tesseract) on an image or PDF',
+  keywords: ['ocr', 'image', 'tesseract', 'pdf'],
+  component: () => import('./ocr-image.vue'),
+  icon: Scan,
+  createdAt: new Date('2024-03-09'),
+});
diff --git a/src/tools/ocr-image/ocr-image.vue b/src/tools/ocr-image/ocr-image.vue
@@ -0,0 +1,251 @@
+<script setup lang="ts">
+import type { Ref } from 'vue';
+import { createWorker } from 'tesseract.js';
+import { getDocument } from 'pdfjs-dist';
+import * as pdfJS from 'pdfjs-dist';
+import pdfJSWorkerURL from 'pdfjs-dist/build/pdf.worker?url';
+import { textStatistics } from '../text-statistics/text-statistics.service';
+import TextareaCopyable from '@/components/TextareaCopyable.vue';
+import { useQueryParamOrStorage } from '@/composable/queryParams';
+
+const languages = [
+  { name: 'English', code: 'eng' },
+  { name: 'Portuguese', code: 'por' },
+  { name: 'Afrikaans', code: 'afr' },
+  { name: 'Albanian', code: 'sqi' },
+  { name: 'Amharic', code: 'amh' },
+  { name: 'Arabic', code: 'ara' },
+  { name: 'Assamese', code: 'asm' },
+  { name: 'Azerbaijani', code: 'aze' },
+  { name: 'Azerbaijani - Cyrillic', code: 'aze_cyrl' },
+  { name: 'Basque', code: 'eus' },
+  { name: 'Belarusian', code: 'bel' },
+  { name: 'Bengali', code: 'ben' },
+  { name: 'Bosnian', code: 'bos' },
+  { name: 'Bulgarian', code: 'bul' },
+  { name: 'Burmese', code: 'mya' },
+  { name: 'Catalan; Valencian', code: 'cat' },
+  { name: 'Cebuano', code: 'ceb' },
+  { name: 'Central Khmer', code: 'khm' },
+  { name: 'Cherokee', code: 'chr' },
+  { name: 'Chinese - Simplified', code: 'chi_sim' },
+  { name: 'Chinese - Traditional', code: 'chi_tra' },
+  { name: 'Croatian', code: 'hrv' },
+  { name: 'Czech', code: 'ces' },
+  { name: 'Danish', code: 'dan' },
+  { name: 'Dutch; Flemish', code: 'nld' },
+  { name: 'Dzongkha', code: 'dzo' },
+  { name: 'English, Middle (1100-1500)', code: 'enm' },
+  { name: 'Esperanto', code: 'epo' },
+  { name: 'Estonian', code: 'est' },
+  { name: 'Finnish', code: 'fin' },
+  { name: 'French', code: 'fra' },
+  { name: 'French, Middle (ca. 1400-1600)', code: 'frm' },
+  { name: 'Galician', code: 'glg' },
+  { name: 'Georgian', code: 'kat' },
+  { name: 'German', code: 'deu' },
+  { name: 'German Fraktur', code: 'frk' },
+  { name: 'Greek, Modern (1453-)', code: 'ell' },
+  { name: 'Greek, Ancient (-1453)', code: 'grc' },
+  { name: 'Gujarati', code: 'guj' },
+  { name: 'Haitian; Haitian Creole', code: 'hat' },
+  { name: 'Hebrew', code: 'heb' },
+  { name: 'Hindi', code: 'hin' },
+  { name: 'Hungarian', code: 'hun' },
+  { name: 'Icelandic', code: 'isl' },
+  { name: 'Indonesian', code: 'ind' },
+  { name: 'Inuktitut', code: 'iku' },
+  { name: 'Irish', code: 'gle' },
+  { name: 'Italian', code: 'ita' },
+  { name: 'Japanese', code: 'jpn' },
+  { name: 'Javanese', code: 'jav' },
+  { name: 'Kannada', code: 'kan' },
+  { name: 'Kazakh', code: 'kaz' },
+  { name: 'Kirghiz; Kyrgyz', code: 'kir' },
+  { name: 'Korean', code: 'kor' },
+  { name: 'Kurdish', code: 'kur' },
+  { name: 'Lao', code: 'lao' },
+  { name: 'Latin', code: 'lat' },
+  { name: 'Latvian', code: 'lav' },
+  { name: 'Lithuanian', code: 'lit' },
+  { name: 'Macedonian', code: 'mkd' },
+  { name: 'Malay', code: 'msa' },
+  { name: 'Malayalam', code: 'mal' },
+  { name: 'Maltese', code: 'mlt' },
+  { name: 'Marathi', code: 'mar' },
+  { name: 'Nepali', code: 'nep' },
+  { name: 'Norwegian', code: 'nor' },
+  { name: 'Oriya', code: 'ori' },
+  { name: 'Panjabi; Punjabi', code: 'pan' },
+  { name: 'Persian', code: 'fas' },
+  { name: 'Polish', code: 'pol' },
+  { name: 'Pushto; Pashto', code: 'pus' },
+  { name: 'Romanian; Moldavian; Moldovan', code: 'ron' },
+  { name: 'Russian', code: 'rus' },
+  { name: 'Sanskrit', code: 'san' },
+  { name: 'Serbian', code: 'srp' },
+  { name: 'Serbian - Latin', code: 'srp_latn' },
+  { name: 'Sinhala; Sinhalese', code: 'sin' },
+  { name: 'Slovak', code: 'slk' },
+  { name: 'Slovenian', code: 'slv' },
+  { name: 'Spanish; Castilian', code: 'spa' },
+  { name: 'Swahili', code: 'swa' },
+  { name: 'Swedish', code: 'swe' },
+  { name: 'Syriac', code: 'syr' },
+  { name: 'Tagalog', code: 'tgl' },
+  { name: 'Tajik', code: 'tgk' },
+  { name: 'Tamil', code: 'tam' },
+  { name: 'Telugu', code: 'tel' },
+  { name: 'Thai', code: 'tha' },
+  { name: 'Tibetan', code: 'bod' },
+  { name: 'Tigrinya', code: 'tir' },
+  { name: 'Turkish', code: 'tur' },
+  { name: 'Uighur; Uyghur', code: 'uig' },
+  { name: 'Ukrainian', code: 'ukr' },
+  { name: 'Urdu', code: 'urd' },
+  { name: 'Uzbek', code: 'uzb' },
+  { name: 'Uzbek - Cyrillic', code: 'uzb_cyrl' },
+  { name: 'Vietnamese', code: 'vie' },
+  { name: 'Welsh', code: 'cym' },
+  { name: 'Yiddish', code: 'yid' },
+];
+const languagesOptions = Array.from(languages.map(l => ({
+  label: l.name,
+  value: l.code,
+})));
+
+const language = useQueryParamOrStorage({ name: 'lang', storageName: 'ocr-image:lang', defaultValue: 'eng' });
+
+const pageSeparator = '\n=============\n';
+const ocrInProgress = ref(false);
+const fileInput = ref() as Ref<File>;
+const ocrText = computedAsync(async () => {
+  try {
+    return (await ocr(fileInput.value, language.value));
+  }
+  catch (e: any) {
+    return e.toString();
+  }
+});
+const stats = computed(() => textStatistics(ocrText.value?.replace(new RegExp(pageSeparator, 'g'), ' ') || ''));
+const pageCount = computed(() => ocrText.value?.split(new RegExp(pageSeparator, 'g')).length || 0);
+
+async function onUpload(file: File) {
+  if (file) {
+    fileInput.value = file;
+  }
+}
+
+async function loadPdfFile(file: File) {
+  const arrBuffer = await file.arrayBuffer();
+  const byteArray = new Uint8Array(arrBuffer);
+  return getDocument({ data: byteArray }).promise;
+}
+
+async function convertPdfToImage(file: File) {
+  const pdf = await loadPdfFile(file);
+  const container = document.getElementById('container');
+  const images = [];
+  for (let pageNumber = 1; pageNumber <= pdf.numPages; pageNumber++) {
+    const page = await pdf.getPage(pageNumber);
+    const viewport = page.getViewport({ scale: 1.5 });
+    const canvas = document.createElement('canvas');
+    canvas.height = viewport.height;
+    canvas.width = viewport.width;
+    container?.appendChild(canvas);
+    await page.render({
+      canvasContext: canvas.getContext('2d') as CanvasRenderingContext2D,
+      viewport,
+    }).promise;
+    images.push(canvas.toDataURL('image/png'));
+  }
+  return images;
+};
+
+async function ocr(file: File, language: string) {
+  if (!file) {
+    return '';
+  }
+  ocrInProgress.value = true;
+  const worker = await createWorker();
+  await worker.reinitialize(language);
+  const allTexts = [];
+  if (file.type.match('^image/')) {
+    const ret = await worker.recognize(file);
+    allTexts.push(ret.data.text);
+  }
+  else {
+    pdfJS.GlobalWorkerOptions.workerSrc = pdfJSWorkerURL;
+
+    for (const image of (await convertPdfToImage(file))) {
+      const ret = await worker.recognize(image);
+      allTexts.push(ret.data.text);
+    }
+  }
+  await worker.terminate();
+  ocrInProgress.value = false;
+  return allTexts.join(pageSeparator);
+};
+</script>
+
+<template>
+  <div style="max-width: 600px;">
+    <c-select
+      v-model:value="language"
+      label="Language"
+      :options="languagesOptions"
+      searchable mb-2
+    />
+
+    <c-file-upload
+      title="Drag and drop a Image or PDF here, or click to select a file"
+      :paste-image="true"
+      @file-upload="onUpload"
+    />
+
+    <n-divider />
+
+    <div id="container" style="display: none;" />
+
+    <div>
+      <h3>OCR</h3>
+      <TextareaCopyable
+        v-if="!ocrInProgress"
+        v-model:value="ocrText"
+        :word-wrap="true"
+      />
+      <n-spin
+        v-if="ocrInProgress"
+        size="small"
+      />
+    </div>
+
+    <c-card v-if="!ocrInProgress && stats" title="Statistics">
+      <n-space mt-3>
+        <n-statistic label="Character count" :value="stats.chars" />
+        <n-statistic label="Word count" :value="stats.words" />
+        <n-statistic label="Line count" :value="stats.lines" />
+        <n-statistic label="Pages count" :value="pageCount" />
+        <n-statistic label="Sentences count" :value="stats.sentences" />
+      </n-space>
+
+      <n-divider />
+
+      <n-space>
+        <n-statistic label="Chars (no spaces)" :value="stats.chars_no_spaces" />
+        <n-statistic label="Uppercase chars" :value="stats.chars_upper" />
+        <n-statistic label="Lowercase chars" :value="stats.chars_lower" />
+        <n-statistic label="Digit chars" :value="stats.chars_digits" />
+        <n-statistic label="Punctuations" :value="stats.chars_puncts" />
+        <n-statistic label="Spaces chars" :value="stats.chars_spaces" />
+        <n-statistic label="Word count (no punct)" :value="stats.words_no_puncs" />
+      </n-space>
+    </c-card>
+  </div>
+</template>
+
+<style lang="less" scoped>
+::v-deep(.n-upload-trigger) {
+  width: 100%;
+}
+</style>