Initial release: DictIA v0.8.14-alpha (fork de Speakr, AGPL-3.0)

2026-03-16 21:47:37 +00:00
commit 42772a31ed
365 changed files with 103572 additions and 0 deletions
--- a/tests/test_api_v1_speakers.py
+++ b/tests/test_api_v1_speakers.py
@@ -0,0 +1,971 @@
+#!/usr/bin/env python3
+"""
+Test suite for Speaker API v1 endpoints.
+
+Covers:
+  - PUT  /recordings/<id>/speakers/assign   (17 tests)
+  - POST /recordings/<id>/speakers/identify (10 tests)
+  - PUT  /settings/auto-summarization        (5 tests)
+  - Regression for GET /speakers and GET /recordings/<id>/speakers (2 tests)
+
+Pattern follows tests/test_api_v1_upload.py — standalone, no pytest fixtures.
+"""
+
+import json
+import secrets
+import sys
+import os
+from unittest.mock import patch, MagicMock
+
+# Add parent directory so we can import the app
+sys.path.insert(0, os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
+
+from src.app import app, db
+from src.models import User, APIToken, Recording, Speaker
+from src.utils.token_auth import hash_token
+
+# ---------------------------------------------------------------------------
+# Test data constants
+# ---------------------------------------------------------------------------
+
+SAMPLE_TRANSCRIPTION_JSON = json.dumps([
+    {"speaker": "SPEAKER_00", "sentence": "Hi, I'm Alice."},
+    {"speaker": "SPEAKER_01", "sentence": "Hello Alice, I'm Bob."},
+    {"speaker": "SPEAKER_00", "sentence": "Nice to meet you, Bob."},
+])
+
+SAMPLE_TRANSCRIPTION_TEXT = (
+    "[SPEAKER_00]: Hi, I'm Alice.\n"
+    "[SPEAKER_01]: Hello Alice, I'm Bob.\n"
+    "[SPEAKER_00]: Nice to meet you, Bob."
+)
+
+SAMPLE_EMBEDDINGS = json.dumps({
+    "SPEAKER_00": [0.1] * 256,
+    "SPEAKER_01": [0.2] * 256,
+})
+
+# ---------------------------------------------------------------------------
+# Helpers
+# ---------------------------------------------------------------------------
+
+
+def _get_or_create_test_user(suffix=""):
+    """Get or create a test user. Returns (user, created_bool)."""
+    username = f"speaker_test_user{suffix}"
+    user = User.query.filter_by(username=username).first()
+    created = False
+    if not user:
+        user = User(
+            username=username,
+            email=f"{username}@local.test",
+            name="Test User" if not suffix else None,
+        )
+        db.session.add(user)
+        db.session.commit()
+        created = True
+    return user, created
+
+
+def _create_api_token(user):
+    """Create a fresh API token. Returns (token_record, plaintext)."""
+    plaintext = f"test-token-{secrets.token_urlsafe(16)}"
+    token = APIToken(
+        user_id=user.id,
+        token_hash=hash_token(plaintext),
+        name="test-api-token",
+    )
+    db.session.add(token)
+    db.session.commit()
+    return token, plaintext
+
+
+def _create_test_recording(user, transcription=None, speaker_embeddings=None, status="COMPLETED"):
+    """Create a Recording owned by *user*."""
+    rec = Recording(
+        user_id=user.id,
+        title="Test Recording",
+        status=status,
+        transcription=transcription,
+        speaker_embeddings=speaker_embeddings,
+    )
+    db.session.add(rec)
+    db.session.commit()
+    return rec
+
+
+def _create_test_speaker(user, name="Alice"):
+    """Create a Speaker owned by *user*."""
+    speaker = Speaker(name=name, user_id=user.id)
+    db.session.add(speaker)
+    db.session.commit()
+    return speaker
+
+
+def _cleanup(*objects):
+    """Delete DB objects in reverse order, committing once."""
+    for obj in reversed(objects):
+        try:
+            db.session.delete(obj)
+        except Exception:
+            db.session.rollback()
+            try:
+                merged = db.session.merge(obj)
+                db.session.delete(merged)
+            except Exception:
+                pass
+    db.session.commit()
+
+
+# =========================================================================
+# Group 1: PUT /recordings/<id>/speakers/assign  (17 tests)
+# =========================================================================
+
+
+def test_assign_no_auth():
+    """No token -> 302 redirect (Flask-Login)."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              json={"speaker_map": {}})
+            assert resp.status_code in (302, 401), f"Expected 302/401, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_recording_not_found():
+    """Nonexistent recording ID -> 404."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.put("/api/v1/recordings/999999/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {}})
+            assert resp.status_code == 404, f"Expected 404, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_wrong_user_recording():
+    """Other user's recording -> 403."""
+    with app.app_context():
+        owner, co = _get_or_create_test_user("_owner")
+        other, cu = _get_or_create_test_user("_other")
+        token_rec, token = _create_api_token(other)
+        rec = _create_test_recording(owner, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "Alice"}})
+            assert resp.status_code == 403, f"Expected 403, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(other)
+            if co:
+                _cleanup(owner)
+
+
+def test_assign_missing_speaker_map():
+    """Body {} -> 400 'speaker_map is required'."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            body = resp.get_json()
+            assert "speaker_map" in body.get("error", "").lower(), f"Unexpected error: {body}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_invalid_speaker_map_type():
+    """speaker_map: 'string' -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": "not a dict"})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_string_value_json_transcript():
+    """Happy path: string names update JSON segments + participants."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "Alice", "SPEAKER_01": "Bob"}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("success") is True
+            # Verify participants
+            participants = body["recording"]["participants"]
+            assert "Alice" in participants and "Bob" in participants
+            # Verify transcription was updated
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "Alice"
+            assert segments[1]["speaker"] == "Bob"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_object_value_with_name():
+    """Happy path: {name, isMe} object format."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {
+                                  "SPEAKER_00": {"name": "Alice", "isMe": False},
+                              }})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "Alice"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_is_me_flag_with_user_name():
+    """isMe: true resolves to user.name."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()  # user.name == "Test User"
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {
+                                  "SPEAKER_00": {"name": "", "isMe": True},
+                              }})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "Test User", f"Got {segments[0]['speaker']}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_is_me_flag_without_user_name():
+    """isMe: true falls back to 'Me' when user.name is None."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user("_noname")
+        # Ensure user.name is None
+        user.name = None
+        db.session.commit()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {
+                                  "SPEAKER_00": {"name": "", "isMe": True},
+                              }})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "Me", f"Got {segments[0]['speaker']}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_plain_text_transcript():
+    """Replaces [SPEAKER_XX] in plain text format."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_TEXT)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "Alice", "SPEAKER_01": "Bob"}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            db.session.refresh(rec)
+            assert "[Alice]" in rec.transcription
+            assert "[Bob]" in rec.transcription
+            assert "[SPEAKER_00]" not in rec.transcription
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_speaker_xx_filtered_from_participants():
+    """Unresolved SPEAKER_XX labels excluded from participants."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            # Only assign one speaker - SPEAKER_01 stays unresolved
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "Alice"}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            participants = body["recording"]["participants"]
+            assert "SPEAKER_01" not in participants, f"SPEAKER_01 should be filtered: {participants}"
+            assert "Alice" in participants
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_invalid_value_type():
+    """Array value -> 400 'Invalid value type'."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": [1, 2, 3]}})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            body = resp.get_json()
+            assert "invalid value type" in body.get("error", "").lower(), f"Unexpected: {body}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_empty_speaker_map():
+    """Empty speaker_map {} -> 200 with no changes."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("success") is True
+            # Transcription should be unchanged
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "SPEAKER_00"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_regenerate_summary():
+    """regenerate_summary: true -> job_queue.enqueue called, summary_queued: true."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            mock_jq = MagicMock()
+            mock_jq.enqueue = MagicMock(return_value="job-123")
+            with patch("src.services.job_queue.job_queue", mock_jq):
+                resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                                  headers={"X-API-Token": token},
+                                  json={
+                                      "speaker_map": {"SPEAKER_00": "Alice"},
+                                      "regenerate_summary": True,
+                                  })
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("summary_queued") is True
+            mock_jq.enqueue.assert_called_once()
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_embeddings_updated():
+    """With speaker_embeddings -> update_speaker_embedding called, counts returned."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(
+            user,
+            transcription=SAMPLE_TRANSCRIPTION_JSON,
+            speaker_embeddings=SAMPLE_EMBEDDINGS,
+        )
+        speaker = _create_test_speaker(user, "Alice")
+        client = app.test_client()
+        try:
+            mock_update = MagicMock()
+            mock_snippets = MagicMock(return_value=2)
+            with patch("src.services.speaker_embedding_matcher.update_speaker_embedding", mock_update), \
+                 patch("src.services.speaker_snippets.create_speaker_snippets", mock_snippets):
+                resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                                  headers={"X-API-Token": token},
+                                  json={"speaker_map": {"SPEAKER_00": "Alice"}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("embeddings_updated") >= 1, f"embeddings_updated: {body}"
+            mock_update.assert_called()
+            return True
+        finally:
+            _cleanup(rec, speaker, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_no_transcription():
+    """Recording without transcription -> speakers applied to empty content gracefully."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=None)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "Alice"}})
+            # Should succeed (or at least not 500)
+            assert resp.status_code in (200, 400), f"Expected 200/400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_assign_whitespace_name_trimmed():
+    """Names with leading/trailing whitespace get trimmed."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.put(f"/api/v1/recordings/{rec.id}/speakers/assign",
+                              headers={"X-API-Token": token},
+                              json={"speaker_map": {"SPEAKER_00": "  Alice  "}})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            db.session.refresh(rec)
+            segments = json.loads(rec.transcription)
+            assert segments[0]["speaker"] == "Alice", f"Name not trimmed: '{segments[0]['speaker']}'"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+# =========================================================================
+# Group 2: POST /recordings/<id>/speakers/identify  (10 tests)
+# =========================================================================
+
+
+def test_identify_no_auth():
+    """No token -> 302."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify")
+            assert resp.status_code in (302, 401), f"Expected 302/401, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_recording_not_found():
+    """Nonexistent ID -> 404."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.post("/api/v1/recordings/999999/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 404, f"Expected 404, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_wrong_user_recording():
+    """Other user's recording -> 403."""
+    with app.app_context():
+        owner, co = _get_or_create_test_user("_id_owner")
+        other, cu = _get_or_create_test_user("_id_other")
+        token_rec, token = _create_api_token(other)
+        rec = _create_test_recording(owner, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 403, f"Expected 403, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(other)
+            if co:
+                _cleanup(owner)
+
+
+def test_identify_no_transcription():
+    """No transcription -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=None)
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_non_json_transcription():
+    """Plain text -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_TEXT)
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_json_but_not_list():
+    """Dict JSON -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=json.dumps({"key": "value"}))
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_happy_path():
+    """Mock LLM returns names -> 200 with speaker_map."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            # Build a mock LLM completion response
+            mock_completion = MagicMock()
+            mock_completion.choices = [MagicMock()]
+            mock_completion.choices[0].message.content = json.dumps({
+                "SPEAKER_00": "Alice",
+                "SPEAKER_01": "Bob",
+            })
+
+            with patch("src.services.llm.call_llm_completion", return_value=mock_completion), \
+                 patch("src.models.system.SystemSetting") as mock_ss:
+                mock_ss.get_setting.return_value = 30000
+                resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                                   headers={"X-API-Token": token})
+
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("success") is True
+            sm = body.get("speaker_map", {})
+            assert sm.get("SPEAKER_00") == "Alice"
+            assert sm.get("SPEAKER_01") == "Bob"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_post_processing_unknown_values():
+    """'Unknown'/'N/A' cleared to ''."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            mock_completion = MagicMock()
+            mock_completion.choices = [MagicMock()]
+            mock_completion.choices[0].message.content = json.dumps({
+                "SPEAKER_00": "Unknown",
+                "SPEAKER_01": "N/A",
+            })
+
+            with patch("src.services.llm.call_llm_completion", return_value=mock_completion), \
+                 patch("src.models.system.SystemSetting") as mock_ss:
+                mock_ss.get_setting.return_value = 30000
+                resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                                   headers={"X-API-Token": token})
+
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            sm = body.get("speaker_map", {})
+            assert sm.get("SPEAKER_00") == "", f"Expected empty, got {sm.get('SPEAKER_00')}"
+            assert sm.get("SPEAKER_01") == "", f"Expected empty, got {sm.get('SPEAKER_01')}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_no_speakers_in_transcript():
+    """Segments without speaker field -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        no_speakers = json.dumps([{"sentence": "Hello"}, {"sentence": "World"}])
+        rec = _create_test_recording(user, transcription=no_speakers)
+        client = app.test_client()
+        try:
+            resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                               headers={"X-API-Token": token})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_identify_llm_error():
+    """LLM raises exception -> 500."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            with patch("src.services.llm.call_llm_completion",
+                       side_effect=RuntimeError("LLM down")), \
+                 patch("src.models.system.SystemSetting") as mock_ss:
+                mock_ss.get_setting.return_value = 30000
+                resp = client.post(f"/api/v1/recordings/{rec.id}/speakers/identify",
+                                   headers={"X-API-Token": token})
+            assert resp.status_code == 500, f"Expected 500, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+# =========================================================================
+# Group 3: PUT /settings/auto-summarization  (5 tests)
+# =========================================================================
+
+
+def test_auto_summarization_no_auth():
+    """No token -> 302."""
+    with app.app_context():
+        client = app.test_client()
+        resp = client.put("/api/v1/settings/auto-summarization",
+                          json={"enabled": True})
+        assert resp.status_code in (302, 401), f"Expected 302/401, got {resp.status_code}"
+        return True
+
+
+def test_auto_summarization_missing_enabled():
+    """Body {} -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.put("/api/v1/settings/auto-summarization",
+                              headers={"X-API-Token": token},
+                              json={})
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            body = resp.get_json()
+            assert "enabled" in body.get("error", "").lower(), f"Unexpected: {body}"
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_auto_summarization_invalid_json():
+    """Non-JSON body -> 400."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.put("/api/v1/settings/auto-summarization",
+                              headers={"X-API-Token": token,
+                                       "Content-Type": "application/json"},
+                              data="not valid json")
+            assert resp.status_code == 400, f"Expected 400, got {resp.status_code}"
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_auto_summarization_enable():
+    """enabled: true -> updates user, returns true."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        user.auto_summarization = False
+        db.session.commit()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.put("/api/v1/settings/auto-summarization",
+                              headers={"X-API-Token": token},
+                              json={"enabled": True})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("auto_summarization") is True
+            db.session.refresh(user)
+            assert user.auto_summarization is True
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_auto_summarization_disable():
+    """enabled: false -> updates user, returns false."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        user.auto_summarization = True
+        db.session.commit()
+        token_rec, token = _create_api_token(user)
+        client = app.test_client()
+        try:
+            resp = client.put("/api/v1/settings/auto-summarization",
+                              headers={"X-API-Token": token},
+                              json={"enabled": False})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            assert body.get("auto_summarization") is False
+            db.session.refresh(user)
+            assert user.auto_summarization is False
+            return True
+        finally:
+            _cleanup(token_rec)
+            if cu:
+                _cleanup(user)
+
+
+# =========================================================================
+# Group 4: Regression tests  (2 tests)
+# =========================================================================
+
+
+def test_regression_get_speakers_list():
+    """GET /speakers still returns user's speakers."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        speaker = _create_test_speaker(user, "Regression Speaker")
+        client = app.test_client()
+        try:
+            resp = client.get("/api/v1/speakers",
+                              headers={"X-API-Token": token})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            names = [s["name"] for s in body.get("speakers", [])]
+            assert "Regression Speaker" in names, f"Speaker not found: {names}"
+            return True
+        finally:
+            _cleanup(speaker, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+def test_regression_get_recording_speakers():
+    """GET /recordings/<id>/speakers still returns transcript speakers."""
+    with app.app_context():
+        user, cu = _get_or_create_test_user()
+        token_rec, token = _create_api_token(user)
+        rec = _create_test_recording(user, transcription=SAMPLE_TRANSCRIPTION_JSON)
+        client = app.test_client()
+        try:
+            with patch("src.services.speaker_embedding_matcher.find_matching_speakers", return_value={}):
+                resp = client.get(f"/api/v1/recordings/{rec.id}/speakers",
+                                  headers={"X-API-Token": token})
+            assert resp.status_code == 200, f"Expected 200, got {resp.status_code}"
+            body = resp.get_json()
+            labels = [s["label"] for s in body.get("speakers", [])]
+            assert "SPEAKER_00" in labels and "SPEAKER_01" in labels, f"Labels: {labels}"
+            return True
+        finally:
+            _cleanup(rec, token_rec)
+            if cu:
+                _cleanup(user)
+
+
+# =========================================================================
+# Runner
+# =========================================================================
+
+ALL_TESTS = [
+    # Group 1: assign
+    test_assign_no_auth,
+    test_assign_recording_not_found,
+    test_assign_wrong_user_recording,
+    test_assign_missing_speaker_map,
+    test_assign_invalid_speaker_map_type,
+    test_assign_string_value_json_transcript,
+    test_assign_object_value_with_name,
+    test_assign_is_me_flag_with_user_name,
+    test_assign_is_me_flag_without_user_name,
+    test_assign_plain_text_transcript,
+    test_assign_speaker_xx_filtered_from_participants,
+    test_assign_invalid_value_type,
+    test_assign_empty_speaker_map,
+    test_assign_regenerate_summary,
+    test_assign_embeddings_updated,
+    test_assign_no_transcription,
+    test_assign_whitespace_name_trimmed,
+    # Group 2: identify
+    test_identify_no_auth,
+    test_identify_recording_not_found,
+    test_identify_wrong_user_recording,
+    test_identify_no_transcription,
+    test_identify_non_json_transcription,
+    test_identify_json_but_not_list,
+    test_identify_happy_path,
+    test_identify_post_processing_unknown_values,
+    test_identify_no_speakers_in_transcript,
+    test_identify_llm_error,
+    # Group 3: auto-summarization
+    test_auto_summarization_no_auth,
+    test_auto_summarization_missing_enabled,
+    test_auto_summarization_invalid_json,
+    test_auto_summarization_enable,
+    test_auto_summarization_disable,
+    # Group 4: regression
+    test_regression_get_speakers_list,
+    test_regression_get_recording_speakers,
+]
+
+
+def main():
+    print(f"Running {len(ALL_TESTS)} Speaker API tests...\n")
+    passed = 0
+    failed = 0
+    errors = []
+
+    for test_fn in ALL_TESTS:
+        name = test_fn.__name__
+        try:
+            result = test_fn()
+            if result:
+                print(f"  PASS  {name}")
+                passed += 1
+            else:
+                print(f"  FAIL  {name} (returned False)")
+                failed += 1
+                errors.append(name)
+        except Exception as e:
+            print(f"  ERROR {name}: {e}")
+            failed += 1
+            errors.append(name)
+
+    print(f"\n{'=' * 60}")
+    print(f"Results: {passed} passed, {failed} failed out of {len(ALL_TESTS)}")
+    if errors:
+        print("Failed tests:")
+        for e in errors:
+            print(f"  - {e}")
+    print('=' * 60)
+    sys.exit(0 if failed == 0 else 1)
+
+
+if __name__ == "__main__":
+    main()