Es gibt verschieden Wege, um eine Animation zu steuern. Dafür können verschiede Eingabegeräte unabhängig von der Animation gleichzeitig benutzt werden. Da es keine Steuerung gibt, die alleine eine komplette Kontrolle ermöglicht, kann man verschieden Steuerungsarten kombinieren. Das ermöglicht auch mehreren Personen gleichzeitig die Animation in Echtzeit zu kontrollieren.
Ein Skript ist eine Standardmethode, um eine Animation, die aus mehreren verschiedenen Objekten besteht, zu beschreiben. Es ist eine spezielle Sprache, die mit wenigen Schlüsselwörtern spezielle Operationen ausführt. Die meisten automatischen Gesichtsanimationen verwenden diese Möglichkeit. HLSS (s. o.) ist eine solche Sprache.
Der größte Vorteil von Skripten ist ihre Textform. Allerdings hat der Vorteil, daß jeder Benutzer das Skript in jedem Texteditor ändern kann, auch den Nachteil, daß man Änderungen nicht sofort sieht. Daher ist es für Echtzeit-Animation nicht zu gebrauchen sondern sinnvoller für Hintergrund-Animationen.
Eine andere Eingabequelle ist das MIDI-Keyboard. Dabei sind die Tasten des Keyboards die verschiedenen Parameter. Jede Taste kann die Geschwindigkeit und den Druck, mit der die Taste gedrückt wurde, liefern. Diese Werte können z.B. als Intensität und Dauer eines MPAs verwendet werden. Natürlich können auch mehrere Tasten kombiniert werden, um z.B. eine bestimmte Emotion darzustellen.
Man kann eine Animation auch durch Körperhaltung und Gestik, z.B. mit einer Hand, steuern. Bestimmte Haltungen der Hand symbolisieren bestimmte Ausdrücke des Gesichts. Bewegungen der Hand können damit auch das komplett animierte Gesicht bewegen oder einfach nur die Augen oder den Mund.
Die Abtastmethode basiert auf MLP (multi-layer perceptrons) [ErrProp], einer Art künstlichem neuronalen Netzwerk, daß nahezu realistische Funktionen nachbilden kann. Diese Methode bietet sich zum Modellieren an, aber nicht für Echtzeit-Animationen. Besser ist die Verwendung auf einer höheren Ebene, wie der Emotionsebene. Dabei stellt die Handhaltung den Typ der Emotion und die Ausrichtung die Intensität dar. Zum Beispiel könnte das schnelle Öffnen einer Faust "Überraschung" bedeuten. Neben Sequenzen kann man mit dieser Methode auch Feintuning betreiben.
Damit ist die Übertragung von Bewegungen einer reellen Person auf eine Animation in Echtzeit gemeint. Dabei übertragen Sensoren, die an dem Akteur befestigt sind, die Daten der Bewegung und Gestik auf die Animation. Die Basisparameter der Bewegungen sind auch hier die MPAs.