Ein KI-Board so versorgen, dass es plötzliche Lastsprünge durchsteht
Ein KI-Board scheitert mit seinem Power-Design in einem ganz bestimmten Moment: in dem Augenblick, in dem der Beschleuniger vom Leerlauf auf volle Last springt. Die mittlere Leistung im Datenblatt sagt über diesen Moment wenig aus. Eine Neural Engine, die im Wartezustand nur einen Bruchteil eines Ampere zieht, kann innerhalb einer Mikrosekunde nach dem Start des ersten Layers mehrere Ampere abrufen, und die Rails, die sie speisen, halten ihre Spannung über diesen Sprung hinweg, oder das Silizium bricht ein, setzt sich zurück oder verfälscht still und leise eine Inferenz. Den Power Tree für ein KI-Board zu entwerfen heißt, ihn für genau diesen Grenzfall auszulegen, nicht für den Mittelwert.
Die Form des Problems gibt die Last vor, und diese Last gleicht keinem stetig arbeitenden Prozessor. Inferenz kommt in Schüben: Ein Frame trifft ein, der Beschleuniger weckt jede Multiplikationseinheit, die er besitzt, die Rail sackt in Richtung ihrer Unterspannungsschwelle, und wenige Millisekunden später ist die Arbeit getan und der Strom fällt wieder ab. Der Power Tree muss den Sprung liefern, die Entlastung auffangen und das über die gesamte Lebensdauer des Produkts dreißigmal pro Sekunde wiederholen. Jede Stufe dieses Baums ist ein Bauteil, das es auszuwählen gilt, und diese Auswahl reicht vom Wandler direkt neben dem Core bis hinaus zum Stecker, an dem die Versorgung hereinkommt.
Der Lastsprung, nicht die Wattzahl, ist das Design.
Der Sprung, der das Problem definiert
Alles auf dieser Seite hängt an einem einzigen Ereignis, dem Lastsprung, und eine Rail unter einem plötzlichen Beschleuniger-Lastsprung stabil halten ist die ausführlichere Betrachtung dazu. Kurz gesagt: Wenn der Strombedarf springt, braucht die Regelschleife des Reglers Zeit, um zu reagieren, und in dieser Lücke sind die Ausgangskondensatoren das Einzige, was die Rail oben hält. Die Spannung sinkt um so viel Ladung, wie die Last entzieht, bevor die Schleife nachkommt, und die Designfrage lautet, ob dieser Einbruch innerhalb des Fensters bleibt, das das Silizium toleriert. Schleifenbandbreite, Kondensatorimpedanz und die parasitäre Induktivität des Pfads zwischen Wandler und Last teilen sich dieses Budget untereinander auf.
Das Budget ist kleiner, als es aussieht. Eine auf drei Prozent spezifizierte Rail hat schon vor dem ersten Transienten einen Teil dieses Fensters für Regelgenauigkeit und Ripple verbraucht, und was übrig bleibt, ist der Spielraum, den der Einbruch nutzen darf. Wo gemessen wird, entscheidet darüber, ob die Zahlen ehrlich sind: Eine Rail, die am Wandlerausgang sauber aussieht, kann an den Package-Pins bereits einbrechen, weil der Pfad dazwischen Widerstand und Induktivität besitzt, die der Tastkopf am Wandler nie zu sehen bekommt. Am Silizium zu messen, unter dem realen Schaltmuster des Beschleunigers, ist die einzige Version des Tests, die zählt.
Eine dicht aufgebaute Power-Stufe
Die erste Antwort auf einen harten Transienten ist Distanz. Jedes Milliohm zwischen Wandler und Core kostet Droop-Budget, also will die Stufe, die den Beschleuniger speist, unmittelbar an ihm sitzen, und je näher sie sitzt, desto mehr wird ihre eigene Baugröße zum Hindernis. Genau das spricht für Power-Stufen, die Drossel, Schalter und Steuerung in einer einzigen Kontur von wenigen Millimetern zusammenfassen.
TDM22545DXUMA1 als dichte Power-Stufe mit integrierter Drossel ist diese Idee in einem Bauteil: Die Magnetik, die das Layout sonst dominiert, ist ins Package gefaltet, die Schaltschleife schrumpft auf die Größenordnung des Moduls selbst, und mit ihr schrumpfen die abgestrahlte Störung und die Layout-Empfindlichkeit. Eine solche Stufe setzt sich mit einer Handvoll externer Kondensatoren neben die Last und übernimmt die härteste Rail auf dem Board, ohne die sorgfältige Drosselplatzierung zu verlangen, die ein diskretes Design braucht. Der Preis ist Konzentration: Die Wärme, die ein diskretes Layout auf mehrere Bauteile verteilt, verlässt das System nun über einen einzigen Körper, und das Modul ist eine einzige Zeile in der Stückliste, wo eine diskrete Stufe für jedes Teil Alternativen bot.
Ob sich dieser Kompromiss lohnt, hängt vom Board ab. Ein kompaktes Gehäuse mit Höhenbegrenzung und gedrängtem Layout nimmt das Modul und ist froh darüber; ein kostengetriebenes Design mit Flächenreserve fährt womöglich besser, wenn es den Entwicklungsaufwand in eine diskrete Stufe steckt, die es Teil für Teil zweitquellen kann. Dichte wird erkauft, nicht geschenkt, und die richtige Frage lautet, woran es dem Board mangelt.
Multiphase für den hungrigen Core
Ab einem bestimmten Strom hört eine einzelne Phase auf, eine sinnvolle Form für den Wandler zu sein. Ein einzelnes Paar aus Drossel und Schalter, das zig Ampere liefern soll, wird heiß, braucht eine Magnetik, die die Last in den Schatten stellt, und legt den gesamten Transienten auf eine einzige Schleife. Die Rail auf mehrere Phasen aufzuteilen, deren Schaltvorgänge ineinander verschachtelt sind, teilt den Strom, hebt einen Teil des Ripples auf und verteilt die Wärme über das Board, statt sie auf einem Bauteil aufzutürmen.
TPS546B24A im Multiphase-Betrieb für einen Hochstrom-Core zeigt, wie die moderne Variante davon aussieht. Mehrere dieser Bauteile stapeln sich auf einer Rail, teilen sich den Laststrom ohne separate Balancing-Schaltung und beantworten einen Lastsprung gemeinsam, wobei jede Phase ihren Anteil an der Antwort beisteuert, sodass der Einbruch flacher bleibt, als eine einzelne von ihnen es allein schaffen könnte. Das Bauteil trägt seine Management-Schnittstelle auf PMBus, und das macht aus der Rail statt einer Blackbox etwas, das das System auslesen kann: Ausgangsspannung, Strom je Phase und Die-Temperatur sind Live-Register, die Rail lässt sich im Test nach oben und unten margieren, um nachzuweisen, dass das Timing an den Ecken hält, und eine Einheit, die im Feld ausfällt, behält eine Aufzeichnung des Fehlers, der sie lahmgelegt hat. Auf einem Board, das in Stückzahlen ausgeliefert wird, ist diese Telemetrie der Unterschied zwischen einem zurückgeschickten Gerät, das etwas lehrt, und einem, das ein Rätsel bleibt. Das Engineering rund um das Bauteil ist überwiegend Disziplin: Die Phasen wollen symmetrisches Kupfer, damit keine von ihnen den anderen vorauseilt, die Spannungserfassung will eine Kelvin-Führung vom Regelpunkt an den Package-Pins statt einer bequemen Leiterbahn am Wandler, und die Sequenzierung gegenüber den übrigen Rails des SoC muss der Reihenfolge folgen, die das Datenblatt des Siliziums verlangt, denn eine Core-Rail, die vor ihrem Pendant eintrifft, kann einen Prozessor in einen Zustand verriegeln, den keine noch so saubere Regelung mehr behebt. Die Eingangskapazität gehört zur selben Geschichte, denn die Phasen ziehen ihre Ladung in Pulsen aus der Zwischen-Rail, und eine Bank, die für eine Phase ausgelegt ist, lässt vier verhungern; die vorgelagerte Stufe und die Multiphase-Rail werden als Paar entworfen, nicht nacheinander. Die Fehlergrenzen des Controllers verdienen dieselbe Aufmerksamkeit wie seine Spannungseinstellung: Eine auf dem Default belassene Überstromschwelle kann über dem liegen, was die Drosseln vertragen, und eine Temperaturgrenze, die ohne Kenntnis des realen Luftstroms auf dem Board gesetzt wird, löst entweder im Normalbetrieb aus oder schützt vor nichts. Nichts davon ist exotisch, und alles davon entscheidet, ob die Rail die Werte erreicht, die das Datenblatt versprochen hat.
Die Anzahl der Phasen ist ein Designparameter, keine Tugend. Jede Phase bringt feste Verluste mit, die der Wirkungsgrad bei geringer Last bezahlt, also läuft eine für den schlimmsten Burst dimensionierte Rail im Leerlauf schlecht, wenn sie keine Phasen abwerfen kann, sobald der Beschleuniger schläft. Bauteile dieser Klasse reduzieren bei geringer Last auf weniger Phasen und holen sie für den Sprung wieder zurück, und ein Design, das sich darauf stützt, hält beide Enden des Tastverhältnisses ehrlich.
Mit dieser Sorgfalt dimensioniert und ausgelegt, hört die große Rail auf, das Risiko auf dem Board zu sein, und wird zum Vorbild, das die kleineren Rails kopieren.
Die Boardspannung herunterstufen
Den Point-of-Load-Stufen vorgelagert sitzt eine schlichtere Aufgabe: zu nehmen, womit das Produkt gespeist wird, ein 12- oder 24-Volt-Netzteil, ein Industriebus, ein Akkustapel, und daraus die Zwischen-Rail zu machen, aus der sich der Rest des Baums bedient. Diese Stufe bekommt das Rauschen und die Überspannungen des Eingangs zu sehen, und ihre Ausgangsqualität legt den Ausgangspunkt für jeden nachfolgenden Wandler fest.
LM22676MRX-ADJ/NOPB im Board-Level-Step-Down für Compute-Module ist die abgehangene Art von Bauteil, die diese Stufe bevorzugt: ein weiter Eingangsbereich, der die Ausreißer einer Industrieversorgung mit den Schultern zuckt, ein einstellbarer Ausgang, der genau dort landet, wo die Zwischen-Rail geplant ist, und eine Schaltfrequenz, die niedrig genug ist, um die Verluste gelassen zu halten. Es ist nicht das neueste Bauteil auf dieser Seite, und genau das ist seine Qualifikation. Die erste Stufe eines Baums will Langeweile, einen Wandler, dessen Verhalten bekannt ist, dessen Eckfälle andere Leute vor Jahren gefunden haben und dessen Ausgang die nachgelagerten Stufen als gegeben hinnehmen können.
Die Hilfsschaltungen verdienen ihren eigenen kleinen Wandler statt eines Abgriffs von einer vielbeschäftigten Rail. MP2315 für einen kompakten Buck auf der Hilfsbeschaltung passt in diese Lücke: ein kleiner, günstiger, integrierter Buck, der den Lüfter, die Anzeige, den USB-Port, den Housekeeping-Mikrocontroller speist, all die Lasten, die wichtig sind, aber keinen Anteil am Transienten-Budget der Core-Rail verdienen. Sie abzutrennen verhindert, dass ein Lüfteranlauf als Rauschen auf einer Inferenz erscheint, und es kostet ein Bauteil von der Größe eines Fingernagels.
Die zweistufige Form ist der stille Grund, warum sich der Rest des Baums benimmt. Mit einer Zwischen-Rail in der Mitte sieht jeder Point-of-Load-Wandler einen schmalen, bekannten Eingang statt der rohen Versorgung, und jeder lässt sich auf seine eigene Last abstimmen, statt einen Kompromiss für das gesamte Board einzugehen. Die Eingangsstufe nimmt die Hässlichkeit ein einziges Mal auf, und alles Nachgelagerte konstruiert gegen eine saubere Zahl.
Das Eingangsende dieser ersten Stufe trägt die schmucklosen Teile, die über das Überleben statt über die Leistung entscheiden: Verpolschutz für den Tag, an dem der Stecker verkehrt herum hineingezwungen wird, Klemmung für die Überspannung, die das Kabel aufschnappt, Filterung, damit das Board weder unter dem Rauschen der Versorgung leidet noch sie verschmutzt. Nichts davon taucht in einer Demo auf, und alles davon taucht im Feld auf.
Die Rails, die nicht einfach sind
Nicht jede Rail auf einem KI-Board ist eine positive Versorgung, die digitalen Strom liefert. Die analogen Ränder des Systems, die Sensorvorspannung, das Verstärker-Frontend, die Wandlerreferenz verlangen nach Versorgungen, die der Hauptbaum nicht von selbst erzeugt, und sie fallen auf subtilere Weise aus, wenn diese Versorgungen verschmutzt sind.
TPS65131RGER, wenn ein Board eine positive und eine negative Rail braucht beantwortet den ersten Fall mit einem einzigen Bauteil: ein Boost- und ein invertierender Wandler in einem Package, die die gepaarten Versorgungen erzeugen, die eine Verstärkerstufe oder ein vorgespannter Sensor erwartet, ohne dafür zwei getrennte Designs aufzuwenden. Ein Bauteil, ein Layout, beide Polaritäten, und das Board hält seinen Analogteil versorgt, ohne einen zweiten Power Tree wachsen zu lassen.
Der zweite Fall ist das Rauschen. Eine Rail, die einen ADC, einen Takt oder die Analogseite eines Bildsensors speist, trägt jeden Millivolt Wandler-Ripple direkt in die Messung, und die Abhilfe ist eine lineare Stufe hinter dem Schaltwandler. TPS7A4700 für eine rauscharme Rail neben empfindlicher Analogtechnik ist für genau diese Position gebaut, ein LDO, dessen eigener Rauschteppich im Mikrovoltbereich liegt, der eine Schalt-Rail aufnimmt und der Analoginsel eine Versorgung übergibt, die leise genug ist, dass die letzten Bits des Datenwandlers etwas bedeuten. Der Preis ist der als Wärme verheizte Dropout, weshalb die Stufe einem Schaltwandler folgt, der die effiziente Arbeit bereits erledigt hat, und weshalb sie allein die Insel speist statt das ganze Board.
Versorgung für ein Bauteil mit langem Leben
Power-Bauteile altern in einem Katalog anders als Logik, und ein Board, das ein Jahrzehnt lang ausgeliefert wird, muss das einplanen. Die langfristige Versorgung für ein Power-Modul-Bauteil planen ist eine Disziplin für sich, denn ein Power-Modul ist die am schwersten austauschbare Art von Bauteil: Ein Ersatz muss Pinout, Steuerverhalten, Schleifencharakteristik und thermischen Footprint zugleich treffen, und eine Änderung an einem davon öffnet die Qualifizierung eines bereits fertigen Boards erneut. Die Zweitquelle zu benennen oder das Langlebigkeitsprogramm des Moduls nachzuweisen, gehört in das erste Design Review, bevor das Layout die Wahl an Ort und Stelle verschweißt.
Was den Ausschlag gibt
Der Transient entscheidet über die Architektur. Das Droop-Budget wird an den Pins des Siliziums festgelegt und rückwärts durch den Baum verbraucht, und jede Stufe wird gegen den Anteil dieses Budgets ausgewählt, den sie verbrauchen darf. Ein von der Steckdose nach innen entworfener Baum liest sich auf dem Papier gut und scheitert am Package; vom Package nach außen entworfen, funktioniert er.
Das Layout wiegt genauso schwer wie die Bauteile. Die Schleifenflächen, die Sense-Führungen, die Symmetrie der Phasen und das Kupfer, das die Wärme abführt, entscheiden darüber, ob die gewählten Bauteile ihre Datenblattwerte liefern oder nur einen Bruchteil davon, und keine spätere Substitution rettet einen Baum, dessen Geometrie falsch war.
Die Versorgung schließt das Ganze ab, wie überall auf dem Board. Power-Bauteile führen ein langes Leben in langlebigen Produkten, die Module unter ihnen sind am schwersten zu ersetzen, und das Design, das seine Alternativen vor dem ersten Bau benennt, ist dasjenige, das noch ausgeliefert wird, wenn die erste Knappheit eintrifft.




