Ein Mikrofon und ein Vibrationssensor sind dasselbe Instrument, das auf zwei verschiedene Medien gerichtet wird. Das eine misst die Druckwelle, die Schall in Luft erzeugt, das andere misst die Beschleunigung, die eine Maschine in Metall hervorruft, und beide liefern einen Datenstrom, der mechanische Bewegung abbildet. Die Physik dahinter ist eine einzige Physik. Was sich ändert, sind das Medium, die relevanten Frequenzen und die Einheiten auf dem Deckblatt des Datenblatts.
Diese gemeinsame Grundlage ist der Grund, beide zusammen zu behandeln, denn die Auswahlkriterien ähneln sich. Ein Mikrofon wird nach dem leisesten Schall bewertet, den es auflösen kann, und nach dem lautesten, den es ohne Übersteuerung verträgt. Der Abstand zwischen diesen beiden Grenzen ist sein Dynamikbereich. Ein Vibrationssensor wird nach demselben Abstand in anderer Form bewertet: Rauschboden gegen Vollausschlag-Beschleunigung sowie nach der Bandbreite, die bestimmt, welche mechanischen Fehler überhaupt erkennbar sind. Wählt man nach dem Bereich, den die Anwendung braucht, dem Frequenzband, in dem sie arbeitet, und der Schnittstelle, die das Ergebnis überträgt, ergibt sich das Bauteil aus den Anforderungen heraus und nicht aus dem Marketing.
Auswahl eines digitalen MEMS-Mikrofons
Die erste Weiche ist die Schnittstelle, und sie teilt die vier Bauteile in zwei Lager, bevor irgendein anderer Parameter eine Rolle spielt. Ein PDM-Mikrofon überträgt ein Ein-Bit-Signal mit einigen Megahertz, wobei das analoge Signal als Dichte der Einsen in diesem schnellen Datenstrom kodiert wird. Der Host muss einen Dezimationsfilter betreiben, um daraus gewöhnliche Abtastwerte zurückzugewinnen: Das spart Leitungen, belastet aber den Prozessor. Ein I2S-Mikrofon übernimmt diese Konvertierung intern und taktet fertige Mehrbit-Abtastwerte auf einem Standard-Audiobus aus, sodass zwei Exemplare als Stereopaar einen einzigen Bus teilen, ohne dass der Host rechnen muss. Diese Wahl zieht sich durch das gesamte Design: PDM eignet sich für ein kleines Bauteil, das einen Codec speist, der zur Dekodierung ausgelegt ist. I2S eignet sich für einen Mikrocontroller, der sofort verwertbares Audio erwartet. PDM erlaubt es dem Host außerdem, den Takt zu drosseln und damit Bandbreite gegen Leistungsaufnahme zu tauschen, ein Hebel, den I2S nicht bietet. I2S wiederum entlastet den Prozessor von der kontinuierlichen Dezimationsarbeit, die PDM bei jedem Abtastwert verlangt. Die Lager-Entscheidung bestimmt also nicht nur die Verdrahtung, sondern auch, wo die Audiolast im System anfällt.
Der ICS-43434 ist ein digitales MEMS-Mikrofon mit hohem Rauschabstand und I2S-Ausgang. Sein charakteristischer Wert ist ein Signal-Rausch-Verhältnis von rund 65 Dezibel, das es erlaubt, einen ruhigen Raum aufzulösen, wo ein schwächeres Bauteil nur sein eigenes Rauschen hört. Der Rauschabstand entscheidet, wie leise ein Schall noch digitalisierbar ist, und ein hoher Wert trennt ein Mikrofon für Fernfeld-Spracherfassung, bei der der Sprecher quer durch den Raum steht, von einem, das nur nah am Gitter funktioniert. Es taktet fertige Abtastwerte mit bis zu 24-Bit-Wortbreite auf den I2S-Bus, lässt sich für das Beamforming zur Sprecherlokalisierung zu einem Stereopaar zusammenschalten und fordert vom Host nichts außer einem Taktsignal. Seine Übertragungscharakteristik ist im Sprachband flach, und sein niedriger Eigenrauschboden hält den Pegel niedrig, wo ein Fernfeldarray mehrere Einheiten summiert und dabei deren Rauschen zusammen mit dem Nutzsignal addiert. Deshalb findet es sich millionenfach in Smart Speakern und Sprachfernbedienungen.
Der INMP441 ist ein digitales Mikrofon mit I2S-Ausgang und das Bauteil, nach dem zuerst gegriffen wird, wenn Audio ohne jede Analogstufe direkt in einen Mikrocontroller soll. Es bietet dieselbe integrierte Konvertierung, gibt den Standardbus aus und wählt den linken oder rechten Kanal über einen Pin, sodass ein Stereopaar auf eine einzige Leitungsgruppe fällt. Ein integriertes Hochpassfilter unterdrückt Gleichspannungsoffset und tieffrequentes Rumpeln, der Rauschabstand liegt bei rund 61 Dezibel, die Übertragungskurve ist im Sprachband flach, und die Stromaufnahme ist gering genug für ein batteriebetriebenes Spielzeug. Die Spezifikationen liegen knapp unter dem höchsten Niveau, und genau das ist sein Zweck: Es ist das verlässliche, gut dokumentierte, weitverbreitete Einstiegsmikrofon, dasjenige, das jedes Beispielprojekt und jedes Entwicklerboard voraussetzt, und dasjenige, das ein Design so lange verwendet, bis eine Anforderung auftaucht, die es nicht erfüllen kann.
Der IM69D130 ist für die Mikrofonerfassung mit hohem Dynamikbereich ausgelegt, und der Dynamikbereich ist sein einziger Daseinszweck. Er kombiniert einen niedrigen Rauschboden mit einem hohen akustischen Übersteuerungspunkt, dem Schalldruckpegel, ab dem das Ausgangssignal anfängt zu clippen, von knapp 130 Dezibel. Damit löst dasselbe Bauteil ein Flüstern auf und übersteht einen Schall, der ein gewöhnliches Mikrofon überfordern würde. Der Abstand zwischen Boden und Decke beträgt rund 105 Dezibel, und die Phase bleibt bis weit in den Bassbereich hinein konstant, was zählt, wenn mehrere Einheiten einen Beamformer speisen, der ihre Ausgänge addiert und jeden Phasenunterschied bestraft, den die Bauteile sich leisten. Dieser Bereich ist das, was ein Design braucht, wenn der Schall unvorhersehbar ist: eine Bodycam, die sowohl ein leises Gespräch als auch einen Schuss aufzeichnet, eine Drohne über einem lauten Rotor, ein Industriemonitor in Maschinennähe, überall dort, wo Lautes und Leises durch dasselbe Gitter gelangen und beides sauber und unverzerrt zurückkommen muss.
Der MP34DT05 ist ein kompaktes PDM-Mikrofon und gewinnt seinen Platz durch Baugröße und Integration, wenn der Host bereits einen PDM-Eingang bereitstellt. Es ist klein genug, um in die Blende eines Laptops oder den Rand eines Wearables eingebaut zu werden, überträgt sein Ein-Bit-Signal an einen Codec oder Mikrocontroller mit integrierter Dezimation und tauscht die hostseitige Filterarbeit gegen einen Platzbedarf ein, mit dem die I2S-Bauteile nicht mithalten können. Der Takt läuft von wenigen hundert Kilohertz für einen Standby-Abhörmodus bis zu einigen Megahertz für volle Bandbreite, sodass dasselbe Bauteil auf Befehl Auflösung gegen Leistungsaufnahme tauscht. Die omnidirektionale Aufnahme erfasst Schall aus beliebiger Richtung, in die die Blende zeigt. Es ist die Wahl, wenn Platinenfläche knapp ist und ein PDM-Peripheriegerät bereits auf dem Chip vorhanden ist, sodass die Dekodierung keinen zusätzlichen Aufwand kostet und das Mikrofon dort verschwindet, wo für nichts Größeres Platz ist. Mehrere dieser Bauteile entlang einer Kante geben einem Laptop das räumliche Bild, das es braucht, um die Aufnahme auf den Sprecher auszurichten und den Rest des Raums abzudämpfen.

Die zwei Wände, zwischen denen ein Mikrofon lebt
Jedes Mikrofon-Datenblatt erzählt eine Geschichte von zwei Wänden und dem Raum dazwischen. Die untere Wand ist der Rauschboden: das äquivalente Eingangsrauschen, das leise elektrische Rauschen des Bauteils ohne jede Schallquelle. Jeder Schall, der leiser ist als dieses Rauschen, geht darin unter. Die obere Wand ist der akustische Übersteuerungspunkt: der Schalldruckpegel, ab dem der Ausgang dem Eingang nicht mehr folgt und in Verzerrung clippt. Jeder lautere Schall wird verfälscht. Der Abstand zwischen den Wänden ist der Dynamikbereich, der Parameter, der entscheidet, ob ein einzelnes Mikrofon eine Szene bewältigen kann, bevor die lauten Anteile verzerren oder die leisen verschwinden. Deshalb rechtfertigt ein Bauteil mit hohem Dynamikbereich seinen Aufpreis in einer Welt, in der der Ingenieur nicht wählen kann, wie laut die Welt sein wird. Das Signal-Rausch-Verhältnis ist dieselbe untere Wand, gemessen gegen einen Referenzton. Ein Bauteil mit 65 Dezibel hat demnach einen ruhigeren Boden als eines mit 60, und die Dezibel sind logarithmisch, sodass wenige davon eine große Veränderung beim leisesten noch überlebensfähigen Schall bedeuten. Die Empfindlichkeit, in Dezibel relativ zu einer Referenz angegeben, legt nur fest, wo das Signal zwischen den Wänden liegt, nicht wie weit sie auseinanderliegen. Die Empfindlichkeit als Qualitätsmerkmal zu lesen ist der verbreitete Fehler, den das Zwei-Wände-Bild kurieren soll.
Laut oder leise: die Wand, an die es zuerst stößt, ist die entscheidende.
Maschinenvibrationen überwachen
Vibrationssensorik tauscht Luft gegen Metall und richtet denselben Gedanken auf ein Lager. Ein gesunder Motor summt bei einigen Frequenzen, bei denen er schon immer gesummt hat, und ein Fehler schreibt sich als neue Frequenzen in die Vibration ein, lange bevor er laut genug zum Hören oder heiß genug zum Riechen ist. Ein Riss in einem Lagerring klingt bei einer Frequenz, die von der Geometrie und der Drehzahl bestimmt wird, oft bei einigen Kilohertz. Die Oberschwingungen der Wellenfrequenz erzählen weiter unten ihre eigene Geschichte über Unwucht und Fehlausrichtung. Frühzeitiges Erkennen ist die gesamte Prämisse der Zustandsüberwachung: die Praxis, die Vibration einer Maschine zu lesen, um ihre Wartung einzuplanen, bevor sie ausfällt. Die Methode funktioniert durch Vergleich: eine Basislinie, aufgenommen wenn die Maschine nachweislich in Ordnung ist, und jede spätere Messung wird auf Spektrallinien geprüft, die vorher nicht da waren. Die Herausforderung ist die Bandbreite: Ein Sensor, der nur bis zu einigen hundert Hertz misst, was für Neigungsmessung mehr als ausreicht, ist taub gegenüber der Kilohertz-Signatur, die den Fehler ankündigt. Deshalb werden Vibrationsbauteile für diese Aufgabe bewusst breitbandig ausgelegt.
Der ADXL1002 ist für breitbandige Vibrationsmessungen ausgelegt: ein einachsiger Beschleunigungssensor mit flachem Frequenzgang bis rund zehn Kilohertz, einer Resonanz bei etwa einundzwanzig Kilohertz und einem analogen Spannungsausgang, der die rohe Wellenform an den digitalisierenden Host übergibt. Seine niedrige Rauschleistungsdichte von einigen zehn Mikro-g pro Wurzel-Hertz erlaubt es, eine kleine Vibration auf einer großen aufzulösen: den schwachen Lagerton unter der dominanten Wellenrotation. Er verträgt plus-minus fünfzig g, bevor er clippt, ein Kopfraum, der für die kurzen Impulse ausreicht, die ein beschädigtes Lager erzeugt. Als einachsiges Bauteil muss es der Monteur entlang der Richtung ausrichten, in der der Fehler am lautesten spricht, in der Regel radial zur Welle. Der analoge Ausgang ist eine bewusste Wahl: Er platziert das Bauteil dort, wo der Host bereits einen guten Wandler hat und das unverarbeitete Signal für seine eigene Analyse will, in einem Hochfrequenz-Maschinenmonitor, der die frühe Signatur eines versagenden Lagers liest und bei dem das breite, flache Band der eigentliche Mehrwert ist.
Der IIS3DWB ist für breitbandige Vibrationsmessung in der Zustandsüberwachung ausgelegt und löst dasselbe Problem mit einer digitalen Schnittstelle und drei Achsen. Er bietet einen flachen Frequenzgang bis über sechs Kilohertz bei einer Ausgangsdatenrate von mehr als 26.000 Abtastwerten pro Sekunde, weit jenseits eines Allzweck-Beschleunigungssensors, und überträgt das Ergebnis über SPI in einen Puffer, den der Host blockweise ausliest. Der integrierte FIFO ist das Merkmal, das den praktischen Einsatz ermöglicht: Das Bauteil füllt den Puffer, während der Prozessor schläft. Der Host wacht auf, entleert einen Stapel und führt seine Frequenzanalyse durch. Die mittlere Leistungsaufnahme bleibt niedrig genug für einen drahtlosen Monitor, der mit einer Batterie an einer Pumpe für Jahre befestigt ist. Es ist das Bauteil, das speziell für den Predictive-Maintenance-Knoten gebaut wurde, wo drei Achsen, Breitband und niedrige mittlere Leistungsaufnahme gleichzeitig gelten müssen. Sein Messbereich reicht bis plus-minus sechzehn g, und die Rauschleistungsdichte bleibt über dieses breite Band niedrig. Damit überlebt ein kleiner hochfrequenter Ton neben dem großen niederfrequenten Schütteln der Maschine, und die drei Achsen erfassen einen Fehler in beliebiger Richtung, in die er das Gehäuse treibt. Der Monteur muss nicht raten, in welche Richtung er das Bauteil ausrichten soll.

Bandbreite entscheidet, was sichtbar ist
Die Lektion, die Mikrofone und Beschleunigungssensoren verbindet, lautet: Bandbreite und Rauschboden zusammen legen fest, was ein Sensor wahrnehmen kann, und kein noch so ausgefeiltes Signal-Processing holt zurück, was der Sensor nie erfasst hat. Ein auf Telefonqualität bandbegrenztes Mikrofon lässt sich danach nicht in hohe Wiedergabetreue schärfen. Ein Beschleunigungssensor, der bei einigen hundert Hertz abfällt, hat den Lagerfehler verworfen, bevor die Firmware je läuft. Die Abtastung muss die Frequenz erreichen, bei der die Information steckt: beim Sprachband einige Kilohertz, beim Musikband zwanzig Kilohertz des Gehörs, beim Lagerfehler einige Kilohertz des klingenden Risses. Die Abtastrate muss mindestens das Doppelte der obersten Frequenz betragen, sonst faltet die Information als Alias zurück, das kein nachgeschaltetes Filter entwirren kann. Ein Bauteil mit zu schmalem Band ist also eine Messung, die endet, bevor die Antwort ankommt. Der Abfall ist keine Klippe, sondern eine Flanke, sodass ein Sensor mit flachem Frequenzgang bis zehn Kilohertz am oberen Ende dieses Bandes bereits abnimmt. Der Rauschboden setzt die andere Grenze: das kleinste Signal, das das Rauschen überragt. Beide zusammen zeichnen den Bereich, in dem der Sensor arbeiten kann. Alles Nachgelagerte, Filter, Transformationen, Schwellwerte, sortiert das um, was in diesem Bereich steckt, und fügt nichts von außen hinzu.
Die Bittiefe spielt für die Amplitude die Rolle, die die Bandbreite für die Frequenz spielt. Jedes Bit Auflösung kauft rund sechs Dezibel Dynamik zwischen dem kleinsten Schritt und dem Vollausschlag, sodass ein 16-Bit-Datenstrom weit mehr vom leisen Detail trägt als ein 8-Bit-Datenstrom. Ein Mikrofon mit großem Dynamikbereich ist hinter einem zu grobkörnigen Wandler verschwendet. Die Passung gilt in beide Richtungen: Ein rauschgünstiger Sensor braucht die Bits, um zu zeigen, was er gehört hat, und die Bits brauchen einen rauschgünstigen Sensor, sonst lösen sie nur das Rauschen in feinerem Korn auf. Eine 16-Bit-Aufnahme eines verrauschten Mikrofons enthält keine echte Mehrinformation gegenüber zwölf Bit; die unteren Bits sind mit nichts als Rauschen gefüllt.
Die Schnittstelle sortiert dann den Rest. PDM und I2S übertragen Audio, Analog und SPI übertragen Vibration, und die richtige Wahl hängt davon ab, was auf dem Host wartet: Ein Codec mit PDM-Eingang will den MP34DT05, ein Mikrocontroller will die I2S-Bauteile, eine Platine mit einem freien Wandler und Bedarf nach Rohdaten will den analogen ADXL1002, und ein stromsparender digitaler Knoten will den IIS3DWB mit seinem FIFO als Puffer. Der Sensor, der den Bus spricht, den der Host ohnehin beherrscht, spart eine Übersetzungsschicht, die Leistung, Leitungen und Code kostet. Ein PDM-Bauteil hinter einem Chip ohne PDM-Peripherie erzwingt einen Software-Dezimator, der Taktzyklen verbraucht, die das Budget anderswo wollte. Die Bus-Passung ist also eine Systementscheidung, bevor sie eine Sensorentscheidung ist.

Die Wahl verläuft also vom Signal zurück zum Bauteil. Luft oder Metall entscheidet zwischen Mikrofon und Beschleunigungssensor. Der lauteste und leiseste Pegel, den die Szene liefern wird, legt den Dynamikbereich fest. Die höchste Frequenz, bei der Information steckt, legt die Bandbreite fest. Und der Bus, der bereits auf dem Host vorhanden ist, legt die Schnittstelle fest. Diese vier richtig zu treffen bedeutet, dass der Rest Arithmetik auf einem sauber eingegangenen Signal ist. Band oder Rauschboden falsch zu treffen bedeutet, dass keine spätere Cleverness eine Aufnahme rettet, die die Antwort nie enthielt.




