Damit hast du das eigentliche Problem auch schon im Prinzip geklärt:
Wenn das OCR Programm mit einem Teil deiner Seite nicht klar kommt, also keinen verbindlichen Text erkennt, bleibt dieser Teil Bild und kann somit auch nur als Bild oder Teil eines Bildes getilgt werden.
Solange also nicht wirklich alles auf der Seite per OCR von Bild zu Text gewandelt wurde, wirst du dieses Problem immer haben.
als Antwort auf: [#569970]