Screenshots nach PDF

9. Dezember 2021

Anstelle beim Erstellen von Screenshots während Onlinepräsentationen akribisch darauf zu achten, damit die Screenshots gleich oder wenigstens ähnlich groß sind, macht es mehr Sinn Screenshots vom gesamten Bildschirm bzw. von allen Bildschirmen zu machen und im Anschluss den relevanten Bereich auszuschneiden. Das geht mit ImageMagick und ist wieder skriptbar (crop.sh).

#!/bin/sh

# setup: notebook, two monitors attached
# screenshots taken during zoom meeting ([WIN]+[SHIFT]+[Print] = screenshot of the whole screen) have a resolution of 5760x1200
# this crop command will get rid of unnecessary borders (also zoom stuff)
# maybe the borders change with every presentation/presenter,
# simply adapt the geometric parameters.
# 1920x1080 is the size of the rectangle to extract
# +1920+60 is the starting point for the rectangle starting at the left upper corner of the image

for f in *.png;
do
   mogrify -crop 1920x1080+1920+60 +repage "$f"
done

# create pdf
convert *.png tmp.pdf

# throw OCR onto pdf
ocrmypdf tmp.pdf tmp_ocr.pdf

Das Skript selbst ist eine einfache For-Schleife, die den zwischen do und done geklammerten Befehl solange ausführt bis die Schleifenbedingung nicht mehr erfüllt ist. In diesem Fall wird der Schleife eine Liste an im Verzeichnis befindlichen .png-Dateien übergeben und die Dateien der Reihe nach verwendet. Die Operation erstellt hierbei keine neuen Dateien, sondern verändert die übergebenen unwiederbringlich! Daher sollte das Skript nur dann ausgeführt werden, wenn die Parameter (1920x1080+1920+60) stimmen. Die letzten beiden Schritte erstellen dann die gewünschte PDF-Datei, mit angewandter Texterkennung.

PDFs + OCR

7. Oktober 2020

Liederliste aus Radiostream extrahieren

22. November 2019

csv nach png

15. Oktober 2019