Ich teste AI-Chatbot, LLM- und NLP-Modelle auf Genauigkeit, Bias, QA und Leistung
Qualitätssicherungsingenieur
Über diesen Service
80 % der LLMs halluzinieren, deins muss das nicht.
Ich bin QA-Ingenieur mit Schwerpunkt auf Stress-Tests für AI-Chatbots & LLM-Apps, um Halluzinationen, Logiklücken, Jailbreak-Risiken und Sicherheitsprobleme zu erkennen. Ich liefere einen forensischen Bericht innerhalb von 48 Stunden, damit deine Nutzer niemals unvorhersehbare Ausgaben sehen.
WAS DU BEKOMMST:
Halluzinationsmatrix (200+ adversariale Prompts)
Logik-Konsistenz-Bewertung in wichtigen Bereichen
Versuche mit Prompt-Injection/Jailbreak (basierend auf OWASP)
Reproduktionsschritte, Schweregrad, Lösungen und Video-Beweise
Optionale Sprachführung
WARUM ICH:
Über 6 Jahre QA-Automatisierung, ISTQB-zertifiziert, veröffentlicht im Bereich Prompt Engineering, über 400 Fiverr QA-Gigs mit fünf Sternen.
PROZESS:
URL/API teilen. Ich erstelle domänenspezifische adversariale Tests, führe automatisierte und manuelle Tests durch und liefere ein Notion-Dashboard + PDF + Fehlerliste. Optional Zoom-Review.
PAKETE:
BASIC $75 (2 Tage)
- 50 Prompts
- 5-seitiger Fehlerbericht
- 1 Überarbeitung
STANDARD $165 (3 Tage)
- 150 Prompts + Kontinuität
- 10-seitiger Bericht + Heatmap
- 5 Injection-Tests
- Video der Top-Fehler
- 2 Überarbeitungen
PREMIUM $325 (5 Tage)
- Über 300 Multi-Turn/Code/Mathe/Sicherheits-Tests
- Vollständige OWASP-Audit
- Benchmark gegen 2 Modelle
- 30-minütige Beratung + 14 Tage Support
- Unbegrenzte Überarbeitungen
EXTRAS
- Same-day +$50
- API-Load-Test (1k) +$75
Anwendung testen:
Website
Entwicklungstechnologie:
Django
•
JavaScript
•
Python
•
React
•
SQL
Gerät:
PC
•
Mac
•
iPhone
•
iPad
•
Android-Mobiltelefon
Mein Portfolio
FAQ
Automatische Übersetzung
Brauchst du den Source-Code?
Nein. Nur Black-box-Tests. Wenn du White-box-Tests möchtest, bestelle das Premium Extra.
Kannst du OpenAI GPTs, Claude, Llama, RAG-Pipelines testen?
Es – jedes Modell oder Orchestrierungsschicht.
Was, wenn keine Fehler gefunden werden?
Du erhältst immer noch ein vollständiges Audit-Log, das die Robustheit beweist – ein großartiges Marketing-Asset.
Sind meine Daten sicher?
Absolut. Ich unterschreibe NDAs und lösche alle Gesprächsprotokolle nach 14 Tagen, es sei denn, du verlangst es früher.
