dify/api/events/event_handlers/deduct_quota_when_messaeg_created.py

from core.entities.application_entities import ApplicationGenerateEntity
from core.entities.provider_entities import QuotaUnit
from events.message_event import message_was_created
from extensions.ext_database import db
from models.provider import Provider, ProviderType


@message_was_created.connect
def handle(sender, **kwargs):
    message = sender
    application_generate_entity: ApplicationGenerateEntity = kwargs.get('application_generate_entity')

    model_config = application_generate_entity.app_orchestration_config_entity.model_config
    provider_model_bundle = model_config.provider_model_bundle
    provider_configuration = provider_model_bundle.configuration

    if provider_configuration.using_provider_type != ProviderType.SYSTEM:
        return

    system_configuration = provider_configuration.system_configuration

    quota_unit = None
    for quota_configuration in system_configuration.quota_configurations:
        if quota_configuration.quota_type == system_configuration.current_quota_type:
            quota_unit = quota_configuration.quota_unit

            if quota_configuration.quota_limit == -1:
                return

            break

    used_quota = None
    if quota_unit:
        if quota_unit == QuotaUnit.TOKENS:
            used_quota = message.message_tokens + message.answer_tokens
        elif quota_unit == QuotaUnit.CREDITS:
            used_quota = 1

            if 'gpt-4' in model_config.model:
                used_quota = 20
        else:
            used_quota = 1

    if used_quota is not None:
        db.session.query(Provider).filter(
            Provider.tenant_id == application_generate_entity.tenant_id,
            Provider.provider_name == model_config.provider,
            Provider.provider_type == ProviderType.SYSTEM.value,
            Provider.quota_type == system_configuration.current_quota_type.value,
            Provider.quota_limit > Provider.quota_used
        ).update({'quota_used': Provider.quota_used + used_quota})
        db.session.commit()
Model Runtime (#1858) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> Co-authored-by: Garfield Dai <dai.hai@foxmail.com> Co-authored-by: chenhe <guchenhe@gmail.com> Co-authored-by: jyong <jyong@dify.ai> Co-authored-by: Joel <iamjoel007@gmail.com> Co-authored-by: Yeuoly <admin@srmxy.cn> 2024-01-02 23:42:00 +08:00			`from core.entities.application_entities import ApplicationGenerateEntity`
			`from core.entities.provider_entities import QuotaUnit`
			`from events.message_event import message_was_created`
			`from extensions.ext_database import db`
improve: introduce isort for linting Python imports (#1983) 2024-01-12 12:34:01 +08:00			`from models.provider import Provider, ProviderType`
Model Runtime (#1858) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> Co-authored-by: Garfield Dai <dai.hai@foxmail.com> Co-authored-by: chenhe <guchenhe@gmail.com> Co-authored-by: jyong <jyong@dify.ai> Co-authored-by: Joel <iamjoel007@gmail.com> Co-authored-by: Yeuoly <admin@srmxy.cn> 2024-01-02 23:42:00 +08:00

			`@message_was_created.connect`
			`def handle(sender, **kwargs):`
			`message = sender`
			`application_generate_entity: ApplicationGenerateEntity = kwargs.get('application_generate_entity')`

			`model_config = application_generate_entity.app_orchestration_config_entity.model_config`
			`provider_model_bundle = model_config.provider_model_bundle`
			`provider_configuration = provider_model_bundle.configuration`

			`if provider_configuration.using_provider_type != ProviderType.SYSTEM:`
			`return`

			`system_configuration = provider_configuration.system_configuration`

			`quota_unit = None`
			`for quota_configuration in system_configuration.quota_configurations:`
			`if quota_configuration.quota_type == system_configuration.current_quota_type:`
			`quota_unit = quota_configuration.quota_unit`
fix: free quota type apply button missing (#2069) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> 2024-01-17 15:02:27 +08:00
			`if quota_configuration.quota_limit == -1:`
			`return`

Model Runtime (#1858) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> Co-authored-by: Garfield Dai <dai.hai@foxmail.com> Co-authored-by: chenhe <guchenhe@gmail.com> Co-authored-by: jyong <jyong@dify.ai> Co-authored-by: Joel <iamjoel007@gmail.com> Co-authored-by: Yeuoly <admin@srmxy.cn> 2024-01-02 23:42:00 +08:00			`break`

			`used_quota = None`
			`if quota_unit:`
fix: free quota type apply button missing (#2069) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> 2024-01-17 15:02:27 +08:00			`if quota_unit == QuotaUnit.TOKENS:`
			`used_quota = message.message_tokens + message.answer_tokens`
Feat/billing enhancement (#2239) Co-authored-by: takatost <takatost@gmail.com> 2024-01-26 18:26:15 +08:00			`elif quota_unit == QuotaUnit.CREDITS:`
			`used_quota = 1`

			`if 'gpt-4' in model_config.model:`
			`used_quota = 20`
Model Runtime (#1858) Co-authored-by: StyleZhang <jasonapring2015@outlook.com> Co-authored-by: Garfield Dai <dai.hai@foxmail.com> Co-authored-by: chenhe <guchenhe@gmail.com> Co-authored-by: jyong <jyong@dify.ai> Co-authored-by: Joel <iamjoel007@gmail.com> Co-authored-by: Yeuoly <admin@srmxy.cn> 2024-01-02 23:42:00 +08:00			`else:`
			`used_quota = 1`

			`if used_quota is not None:`
			`db.session.query(Provider).filter(`
			`Provider.tenant_id == application_generate_entity.tenant_id,`
			`Provider.provider_name == model_config.provider,`
			`Provider.provider_type == ProviderType.SYSTEM.value,`
			`Provider.quota_type == system_configuration.current_quota_type.value,`
			`Provider.quota_limit > Provider.quota_used`
			`).update({'quota_used': Provider.quota_used + used_quota})`
			`db.session.commit()`