chat-ui-energy

Running

nsarrazin HF Staff commited on Jun 18, 2024

Commit

29ce6ea

1 Parent(s): 7bda7a0

Revert "Request less `max_new_tokens` on tools and reduce `truncate` on CMD R+ (#1292)"

Files changed (2) hide show

chart/env/prod.yaml CHANGED Viewed

@@ -47,7 +47,7 @@ envVars:
         "tools": true,
         "parameters": {
           "stop": ["<|END_OF_TURN_TOKEN|>"],
-          "truncate" : 12288,
           "max_new_tokens" : 2048,
           "temperature" : 0.3
         },

         "tools": true,
         "parameters": {
           "stop": ["<|END_OF_TURN_TOKEN|>"],
+          "truncate" : 28672,
           "max_new_tokens" : 2048,
           "temperature" : 0.3
         },

src/lib/server/textGeneration/tools.ts CHANGED Viewed

@@ -131,7 +131,7 @@ export async function* runTools(
 	for await (const output of await endpoint({
 		messages: messagesWithFilesPrompt,
 		preprompt,
-		generateSettings: { ...assistant?.generateSettings, max_new_tokens: 512 },
 		tools,
 	})) {
 		// model natively supports tool calls

 	for await (const output of await endpoint({
 		messages: messagesWithFilesPrompt,
 		preprompt,
+		generateSettings: assistant?.generateSettings,
 		tools,
 	})) {
 		// model natively supports tool calls