mozilla-ai · aittalam · Nov 14, 2024 · Oct 29, 2024 · Oct 30, 2024 · Nov 2, 2024
diff --git a/.vscode/settings.json b/.vscode/settings.json
@@ -8,5 +8,8 @@
             "source.organizeImports.ruff": "explicit"
         }
     },
-    "python.testing.pytestEnabled": true
+    "python.testing.pytestEnabled": true,
+    "python.analysis.extraPaths": [
+        "./lumigator/python/mzai/schemas"
+    ]
 }
diff --git a/lumigator/python/mzai/backend/backend/api/routes/jobs.py b/lumigator/python/mzai/backend/backend/api/routes/jobs.py
@@ -3,7 +3,8 @@
 from fastapi import APIRouter, status
 from lumigator_schemas.extras import ListingResponse
 from lumigator_schemas.jobs import (
-    JobCreate,
+    JobEvalCreate,
+    JobInferenceCreate,
     JobResponse,
     JobResultDownloadResponse,
     JobResultResponse,
@@ -20,11 +21,11 @@
 @router.post("/inference/", status_code=status.HTTP_201_CREATED)
 def create_inference_job(
     service: JobServiceDep,
-    job_create_request: JobCreate,
+    job_create_request: JobInferenceCreate,
     request: Request,
     response: Response
 ) -> JobResponse:
-    job_response = service.create_inference_job(job_create_request)
+    job_response = service.create_job(job_create_request)
 
     url = request.url_for(get_job.__name__, job_id=job_response.id)
     response.headers[HttpHeaders.LOCATION] = f"{url}"
@@ -35,11 +36,11 @@ def create_inference_job(
 @router.post("/evaluate/", status_code=status.HTTP_201_CREATED)
 def create_evaluation_job(
     service: JobServiceDep,
-    job_create_request: JobCreate,
+    job_create_request: JobEvalCreate,
     request: Request,
     response: Response
 ) -> JobResponse:
-    job_response = service.create_evaluation_job(job_create_request)
+    job_response = service.create_job(job_create_request)
 
     url = request.url_for(get_job.__name__, job_id=job_response.id)
     response.headers[HttpHeaders.LOCATION] = f"{url}"

diff --git a/lumigator/python/mzai/backend/backend/config_templates.py b/lumigator/python/mzai/backend/backend/config_templates.py
@@ -1,4 +1,6 @@
 # Evaluation templates
+from lumigator_schemas.jobs import JobType
+
 seq2seq_eval_template = """{{
     "name": "{job_name}/{job_id}",
     "model": {{ "path": "{model_path}" }},
@@ -83,42 +85,55 @@
     "dataset": {{ "path": "{dataset_path}" }},
 }}"""
 
+
 oai_infer_template = """{{
     "name": "{job_name}/{job_id}",
-    "model": {{
-        "inference": {{
-            "base_url": "{model_url}",
-            "engine": "{model_path}",
-            "system_prompt": "{system_prompt}",
-            "max_retries": 3
-        }}
-    }},
     "dataset": {{ "path": "{dataset_path}" }},
+    "job": {{
+        "max_samples": {max_samples},
+        "storage_path": "{storage_path}",
+        "output_field": "{output_field}"
+    }},
+    "inference_server": {{
+        "base_url": "{model_url}",
+        "engine": "{model_path}",
+        "system_prompt": "{system_prompt}",
+        "max_retries": 3
+    }},
+    "params": {{
+        "max_tokens": {max_tokens},
+        "frequency_penalty": {frequency_penalty},
+        "temperature": {temperature},
+        "top_p": {top_p}
+    }}
 }}"""
 
-config_infer_template = {
-    "hf://facebook/bart-large-cnn": bart_eval_template,
-    "hf://mikeadimech/longformer-qmsum-meeting-summarization": seq2seq_eval_template,
-    "hf://mrm8488/t5-base-finetuned-summarize-news": seq2seq_eval_template,
-    "hf://Falconsai/text_summarization": seq2seq_eval_template,
-    "hf://mistralai/Mistral-7B-Instruct-v0.3": causal_eval_template,
-    "oai://gpt-4o-mini": oai_eval_template,
-    "oai://gpt-4-turbo": oai_eval_template,
-    "oai://gpt-3.5-turbo-0125": oai_eval_template,
-    "mistral://open-mistral-7b": oai_eval_template,
-    "llamafile://mistralai/Mistral-7B-Instruct-v0.2": oai_eval_template,
-}
-
 
-config_eval_template = {
-    "hf://facebook/bart-large-cnn": bart_eval_template,
-    "hf://mikeadimech/longformer-qmsum-meeting-summarization": seq2seq_eval_template,
-    "hf://mrm8488/t5-base-finetuned-summarize-news": seq2seq_eval_template,
-    "hf://Falconsai/text_summarization": seq2seq_eval_template,
-    "hf://mistralai/Mistral-7B-Instruct-v0.3": causal_eval_template,
-    "oai://gpt-4o-mini": oai_eval_template,
-    "oai://gpt-4-turbo": oai_eval_template,
-    "oai://gpt-3.5-turbo-0125": oai_eval_template,
-    "mistral://open-mistral-7b": oai_eval_template,
-    "llamafile://mistralai/Mistral-7B-Instruct-v0.2": oai_eval_template,
+templates = {
+    JobType.INFERENCE: {
+        "default": causal_infer_template,
+        "hf://facebook/bart-large-cnn": bart_eval_template,
+        "hf://mikeadimech/longformer-qmsum-meeting-summarization": seq2seq_eval_template,
+        "hf://mrm8488/t5-base-finetuned-summarize-news": seq2seq_eval_template,
+        "hf://Falconsai/text_summarization": seq2seq_eval_template,
+        "hf://mistralai/Mistral-7B-Instruct-v0.3": causal_eval_template,
+        "oai://gpt-4o-mini": oai_infer_template,
+        "oai://gpt-4-turbo": oai_infer_template,
+        "oai://gpt-3.5-turbo-0125": oai_infer_template,
+        "mistral://open-mistral-7b": oai_infer_template,
+        "llamafile://mistralai/Mistral-7B-Instruct-v0.2": oai_infer_template,
+    },
+    JobType.EVALUATION: {
+        "default": causal_eval_template,
+        "hf://facebook/bart-large-cnn": bart_eval_template,
+        "hf://mikeadimech/longformer-qmsum-meeting-summarization": seq2seq_eval_template,
+        "hf://mrm8488/t5-base-finetuned-summarize-news": seq2seq_eval_template,
+        "hf://Falconsai/text_summarization": seq2seq_eval_template,
+        "hf://mistralai/Mistral-7B-Instruct-v0.3": causal_eval_template,
+        "oai://gpt-4o-mini": oai_eval_template,
+        "oai://gpt-4-turbo": oai_eval_template,
+        "oai://gpt-3.5-turbo-0125": oai_eval_template,
+        "mistral://open-mistral-7b": oai_eval_template,
+        "llamafile://mistralai/Mistral-7B-Instruct-v0.2": oai_eval_template,
+    },
 }
diff --git a/lumigator/python/mzai/backend/backend/services/datasets.py b/lumigator/python/mzai/backend/backend/services/datasets.py
@@ -201,6 +201,9 @@ def delete_dataset(self, dataset_id: UUID) -> None:
         self.dataset_repo.delete(record.id)
 
 
+        # Delete DB record
+        self.dataset_repo.delete(record.id)
+
     def get_dataset_download(self, dataset_id: UUID) -> DatasetDownloadResponse:
         """Generate presigned download URLs for dataset files."""
         record = self._get_dataset_record(dataset_id)