Beispiele, wie zumindest das Vorhandensein eines Textteils oder das Gegenteil festgestellt werden kann, finden sich schon,
z.B.. Ob genau das nun auch funktioniert..

Je nach dem, was du im Grossen und Ganzen haben willst, könnten dich natürlich auch PDF Parser wie pdftotext weiterbringen.
Ich vermute mal Google wird PDFs nicht on-the-fly umwandeln sondern schreibt beim Indexieren schon eine HTML Version in die Datenbank und das nich unbedingt mit PHP. (Wobei es ja auch Leute geben soll, die IRC Bots in PHP realisieren, das nur am Rande..). Abhängig von deinem Ziel könntest du vielleicht auch so arbeiten. Einfach mal bei Google anfragen? :>