AOSSIE-Org · piyush06singhal · Apr 14, 2026 · Apr 14, 2026
diff --git a/backend/Generator/llm_generator.py b/backend/Generator/llm_generator.py
@@ -1,6 +1,7 @@
 import json
 import re
 import threading
+import hashlib
 from llama_cpp import Llama
 
 
@@ -39,9 +40,17 @@ def _prepare_text(self, input_text, max_words=3000):
             input_text = " ".join(words[:max_words])
         return input_text
 
-    def generate_short_questions(self, input_text, max_questions=4):
+    def generate_short_questions(self, input_text, max_questions=4, deterministic=False):
         """Generate short-answer questions from the given text."""
+        # Input validation
+        if not input_text or not isinstance(input_text, str):
+            return []
+
         self._load_model()
+
+        # Compute seed BEFORE text truncation to ensure different inputs produce different seeds
+        seed_value = int(hashlib.sha256(input_text.encode()).hexdigest()[:8], 16) if deterministic else None
+
         input_text = self._prepare_text(input_text)
 
         prompt = (
@@ -52,6 +61,16 @@ def generate_short_questions(self, input_text, max_questions=4):
             f"/no_think"
         )
 
+        params = {
+            "max_tokens": 512,
+            "temperature": 0.7,
+        }
+
+        if deterministic:
+            params["temperature"] = 0.0
+            params["top_p"] = 1.0
+            params["seed"] = seed_value
+
         response = self.llm.create_chat_completion(
             messages=[
                 {
@@ -63,8 +82,7 @@ def generate_short_questions(self, input_text, max_questions=4):
                     "content": prompt,
                 },
             ],
-            max_tokens=512,
-            temperature=0.7,
+            **params
         )
 
         try:
@@ -78,9 +96,17 @@ def generate_short_questions(self, input_text, max_questions=4):
         except (AttributeError, TypeError, ValueError):
             return []
 
-    def generate_mcq_questions(self, input_text, max_questions=4):
+    def generate_mcq_questions(self, input_text, max_questions=4, deterministic=False):
         """Generate multiple-choice questions from the given text."""
+        # Input validation
+        if not input_text or not isinstance(input_text, str):
+            return []
+
         self._load_model()
+
+        # Compute seed BEFORE text truncation to ensure different inputs produce different seeds
+        seed_value = int(hashlib.sha256(input_text.encode()).hexdigest()[:8], 16) if deterministic else None
+
         input_text = self._prepare_text(input_text)
 
         prompt = (
@@ -92,6 +118,16 @@ def generate_mcq_questions(self, input_text, max_questions=4):
             f"/no_think"
         )
 
+        params = {
+            "max_tokens": 1024,
+            "temperature": 0.7,
+        }
+
+        if deterministic:
+            params["temperature"] = 0.0
+            params["top_p"] = 1.0
+            params["seed"] = seed_value
+
         response = self.llm.create_chat_completion(
             messages=[
                 {
@@ -103,8 +139,7 @@ def generate_mcq_questions(self, input_text, max_questions=4):
                     "content": prompt,
                 },
             ],
-            max_tokens=1024,
-            temperature=0.7,
+            **params
         )
 
         try:
@@ -118,9 +153,17 @@ def generate_mcq_questions(self, input_text, max_questions=4):
         except (AttributeError, TypeError, ValueError):
             return []
 
-    def generate_boolean_questions(self, input_text, max_questions=4):
+    def generate_boolean_questions(self, input_text, max_questions=4, deterministic=False):
         """Generate true/false questions from the given text."""
+        # Input validation
+        if not input_text or not isinstance(input_text, str):
+            return []
+
         self._load_model()
+
+        # Compute seed BEFORE text truncation to ensure different inputs produce different seeds
+        seed_value = int(hashlib.sha256(input_text.encode()).hexdigest()[:8], 16) if deterministic else None
+
         input_text = self._prepare_text(input_text)
 
         prompt = (
@@ -131,6 +174,16 @@ def generate_boolean_questions(self, input_text, max_questions=4):
             f"/no_think"
         )
 
+        params = {
+            "max_tokens": 512,
+            "temperature": 0.7,
+        }
+
+        if deterministic:
+            params["temperature"] = 0.0
+            params["top_p"] = 1.0
+            params["seed"] = seed_value
+
         response = self.llm.create_chat_completion(
             messages=[
                 {
@@ -142,8 +195,7 @@ def generate_boolean_questions(self, input_text, max_questions=4):
                     "content": prompt,
                 },
             ],
-            max_tokens=512,
-            temperature=0.7,
+            **params
         )
 
         try:
@@ -157,12 +209,12 @@ def generate_boolean_questions(self, input_text, max_questions=4):
         except (AttributeError, TypeError, ValueError):
             return []
 
-    def generate_all_questions(self, input_text, mcq_count=2, bool_count=2, short_count=2):
+    def generate_all_questions(self, input_text, mcq_count=2, bool_count=2, short_count=2, deterministic=False):
         """Generate a mix of all question types."""
         questions = []
 
         # Generate MCQs
-        mcqs = self.generate_mcq_questions(input_text, mcq_count)
+        mcqs = self.generate_mcq_questions(input_text, mcq_count, deterministic)
         for mcq in mcqs:
             questions.append({
                 "type": "mcq",
@@ -172,7 +224,7 @@ def generate_all_questions(self, input_text, mcq_count=2, bool_count=2, short_co
             })
 
         # Generate Boolean questions
-        bool_qs = self.generate_boolean_questions(input_text, bool_count)
+        bool_qs = self.generate_boolean_questions(input_text, bool_count, deterministic)
         for bool_q in bool_qs:
             questions.append({
                 "type": "boolean",
@@ -181,7 +233,7 @@ def generate_all_questions(self, input_text, mcq_count=2, bool_count=2, short_co
             })
 
         # Generate Short questions
-        short_qs = self.generate_short_questions(input_text, short_count)
+        short_qs = self.generate_short_questions(input_text, short_count, deterministic)
         for short_q in short_qs:
             questions.append({
                 "type": "short_answer",

diff --git a/backend/server.py b/backend/server.py
@@ -101,8 +101,13 @@ def get_shortq_llm():
         input_text = data.get("input_text", "")
         use_mediawiki = data.get("use_mediawiki", 0)
         max_questions = data.get("max_questions", 4)
+        deterministic = data.get("deterministic", False)
+
+        if not isinstance(deterministic, bool):
+            return jsonify({"error": "deterministic must be a boolean"}), 400
+
         input_text = process_input_text(input_text, use_mediawiki)
-        questions = llm_generator.generate_short_questions(input_text, max_questions)
+        questions = llm_generator.generate_short_questions(input_text, max_questions, deterministic)
         return jsonify({"output": questions})
     except Exception as e:
         app.logger.exception("Error in /get_shortq_llm: %s", e)
@@ -116,8 +121,13 @@ def get_mcq_llm():
         input_text = data.get("input_text", "")
         use_mediawiki = data.get("use_mediawiki", 0)
         max_questions = data.get("max_questions", 4)
+        deterministic = data.get("deterministic", False)
+
+        if not isinstance(deterministic, bool):
+            return jsonify({"error": "deterministic must be a boolean"}), 400
+
         input_text = process_input_text(input_text, use_mediawiki)
-        questions = llm_generator.generate_mcq_questions(input_text, max_questions)
+        questions = llm_generator.generate_mcq_questions(input_text, max_questions, deterministic)
         return jsonify({"output": questions})
     except Exception as e:
         app.logger.exception("Error in /get_mcq_llm: %s", e)
@@ -131,8 +141,13 @@ def get_boolq_llm():
         input_text = data.get("input_text", "")
         use_mediawiki = data.get("use_mediawiki", 0)
         max_questions = data.get("max_questions", 4)
+        deterministic = data.get("deterministic", False)
+
+        if not isinstance(deterministic, bool):
+            return jsonify({"error": "deterministic must be a boolean"}), 400
+
         input_text = process_input_text(input_text, use_mediawiki)
-        questions = llm_generator.generate_boolean_questions(input_text, max_questions)
+        questions = llm_generator.generate_boolean_questions(input_text, max_questions, deterministic)
         return jsonify({"output": questions})
     except Exception as e:
         app.logger.exception("Error in /get_boolq_llm: %s", e)
@@ -148,8 +163,13 @@ def get_problems_llm():
         mcq_count = data.get("max_questions_mcq", 2)
         bool_count = data.get("max_questions_boolq", 2)
         short_count = data.get("max_questions_shortq", 2)
+        deterministic = data.get("deterministic", False)
+
+        if not isinstance(deterministic, bool):
+            return jsonify({"error": "deterministic must be a boolean"}), 400
+
         input_text = process_input_text(input_text, use_mediawiki)
-        questions = llm_generator.generate_all_questions(input_text, mcq_count, bool_count, short_count)
+        questions = llm_generator.generate_all_questions(input_text, mcq_count, bool_count, short_count, deterministic)
         return jsonify({"output": questions})
     except Exception as e:
         app.logger.exception("Error in /get_problems_llm: %s", e)