┌─ ThumbStaff UX ──────────┐
│ ████████████████████████ │ ← PC screen (VNC live)
│ ████████████████████████ │
│ ████████████████████████ │
├──────────────────────────┤
│ 🧠 Agent: clicking Login… │ ← AI status
│ Step 3/7 · 2.1s elapsed │
├──────────────────────────┤
│ Task: "Open Notepad, type…"│ ← User input
│ 🎙 Voice │ ⌨ Type │ ← Input mode
├────────────┬─────────────┤
│ ■ STOP │ ▶ RUN │ ← Controls
└──────────────────────────┘
PC screen area
~60% of screen
Agent status
Live step + action
Task input
🎙 Voice or ⌨ Type
Voice engine
Android SpeechRecognizer
Voice latency
<1s on-device
Override
STOP always visible