零售

大模型与数据分析相结合,赋能企业数字化运营成效

作者:管理员 2023-12-25

一些业内人士认为,随着开源大模型能力的提升,算力成本的下降,未来对企业而言,数据的重要性可能会进一步提升,甚至将超过大模型。大数据厂商离数据更近,大模型与大数据···

一些业内人士认为,随着开源大模型能力的提升,算力成本的下降,未来对企业而言,数据的重要性可能会进一步提升,甚至将超过大模型。

大数据厂商离数据更近,大模型与大数据相结合在赋能非技术人员,深化企业数字化转型以及优化商业决策等领域有明显的效果。加上大数据厂商们过往都有不错的AI能力沉淀,大数据领域可能是大模型最先实现商业化领域之一。

01、一家企业有非常多的经营指标,AI可以从效率、经营、协同这三个方面给组织的运营与管理带来变革

首先,AI会提升数据分析效率,释放所有人的潜力。每一个人都可以拥有一个AI数智助理去查找、推荐指标,用户可以基于相应的指标进行层层深入分析和探查,甚至可以用一句话来创建仪表盘。

640.png

第二,以AI赋能运营释放管理的潜力。有了AI数智助理,管理者可以获取到非常客观的数据和报告,它可以24小时随时且快速响应,还能帮助用户进行KPI评估,客观地给出整体的进展分析,同时还可以针对高风险的目标进行分析。

值得一提的是,AI数智助理的能力调用是基于指标平台Kyligence Zen进行的。Kyligence Zen可对组织内部的指标口径进行统一管理,不同部门和层级的人员都基于这一共同口径行动和决策。同时,每项指标都有具体的量化目标,用户可基于这些目标对业务数据进行多维度、全局性、有体系的监控和评估。

例如,用户能从业务目标出发,利用指标平台归因分析能力清晰看到指标变化的贡献因素,同时产品界面还会列出反向贡献因素。AI可基于指标逻辑,给出相比人工更为理性和客观的推断、分析和建议。

这对于管理者而言,只需简单交互就能层层追问出数据背后的业务运营情况,洞察企业运营和管理的细节,释放管理潜力,实现以数据来驱动组织的运营和管理。

第三,以AI加强协同,释放组织的潜力。用户可以通过智能助手对接不同的数据产品,整合不同的第三方软件和系统,以数据产品的形式加强组织间的协同。

总体来看,产品的能力重点并不只是交互对话带来的效率革命。在它背后,指标平台对组织数据文化的培育和沉淀,基于业务目标用数据来驱动运营和管理实践,给组织运营和管理带来的潜力释放,都成为了大模型交互对话产品间的重大能力区分。


02、从先锋企业到大众市场

Gartner的一份报告显示,企业在数据分析领域,越来越关注价值优化和可观察性,重视ROI指标,数据要与业务规则和应用更紧密结合,阐述为组织提供的价值。

实际上,这也是经济增速放缓、市场竞争激烈的背景下,多变的消费需求和高风险的生存环境给大数据领域的玩家们提出的新要求。越来越多企业希望用数据智能工具,切实指导企业的运营和管理,实现数智赋能。

德邦物流CTO殷皓:有一阵子始终对企业内两个维度的数据反馈不太满意。一个是客户体验环节,一个是成本评估环节。

以客户体验环节为例,企业管理层很难从各类已有的数据指标里看到客户对服务的即时态度和反馈。比如,投诉这个指标,只有少部分用户在不满意服务时会选择投诉,大量的用户一旦不满意服务,只会悄悄流失,不再使用产品,企业经营者很难知道用户到底是因为什么原因离开自己的平台。

物流行业里另一个重要的数据指标是成本。企业如果能够把经营数据精细化到每一单快递上,就能更好判断不同部门运营环节里的资产过剩和执行效率不够的问题,从而降低整体经营成本。

这些与业务密切相关的数据管理动作,意味着企业的数据平台上每天要处理的数据量级非常庞大,大概有600亿条数据,每天处理差不多20亿条数据。同时数据指标要能切实反映业务的进展和变化,并且各个系统及层级要统一口径。

除了国内大模型的性能及可用性问题,应用的企业需要有一定的数据治理基础,才能真正把“AI+DATA”的价值发挥出来。

在外界看来,这依然意味着使用门槛,基于“边使用、边治理”的数据使用逻辑,企业里的一些部门可以先用门槛相对低的产品,体验数据智能带来的变革。同时,随着AI带来的进步,过去大量的由人工完成的治理工作部分正由AI完成,减少治理专家的投入。过程中,一些场景的共性显现,再去进一步治理,最终形成一个更成熟的应用模型。这也是AI对软件行业能带来的改造。

在AI时代,这家企业基于过往的产品能力,快速将大语言模型和此前的指标平台及企业级OLAP平台结合,用AI工具来更高效、更便捷帮助企业打造自身的数据智能能力,变革组织运营和管理。这种差异竞争路线,使得他们对自身的定位也在发生变化。

企业的竞争壁垒不仅体现在技术积淀和更全面的产品组合,先锋客户本身也成了大模型应用落地竞争里的壁垒。


03、更自然的人机交互,是永恒的追求

数据分析交互方式的演进,可以视作是一场寻求更佳人机交互方式、降低分析门槛的持久探索。从早期的编程语言和SQL查询,到拖拉拽的数据分析工具,再到基于大模型的自然语言交互方式,我们不断在推进数据分析的普及化和易用性。

早期,数据分析主要依赖于编程语言,比如Python、R等。这类语言通常包含专门用于数据分析的库和工具,如Python的Pandas、NumPy、SciPy等,使得程序员可以通过编写代码来处理和分析数据。然而,这类方式的明显短板在于门槛较高。一方面,用户需要掌握编程知识,包括语法、数据结构和算法等;另一方面,还需了解专门的数据处理库和工具。这样的要求使得非技术背景的用户难以应对。

随着SQL的诞生和流行,数据查询与处理的门槛降低了一些。SQL为结构化的数据提供了一种更为高效和直观的查询方式,其语句近似自然语言,比如“SELECT * FROM table WHERE condition”,直观且易学。然而,SQL仍然需要用户掌握一定的语法知识,而且对于复杂的查询和分析任务,SQL的语句可能会变得冗长且难以理解。此外,SQL主要用于结构化数据,对于非结构化数据,其处理能力有限。

为了进一步降低使用门槛,一种新型的数据分析工具应运而生,即所谓的拖拉拽式数据分析工具,如Tableau、PowerBI等。这些工具通过可视化的界面,让用户可以直观地选择和操作数据,创建数据可视化图表。这种方式相比编程语言和SQL,大大降低了数据分析的门槛,使得非技术用户也能够进行数据分析。

然而,拖拉拽的数据分析交互方式在易用性方面还存在一些问题,主要表现在以下三个方面:

首先,尽管拖拉拽工具相对直观,但用户仍需要花费时间学习如何使用它们。例如,用户需要知道如何添加和删除数据源、如何选择正确的图表类型、如何应用和理解不同的数据操作(如筛选、排序、聚合等)。这些功能和概念,尤其是一些高级的数据操作和分析功能,对于没有数据分析背景的用户来说,可能仍然需要一段时间去理解和掌握。

其次,拖拉拽工具的操作可能会变得相当复杂,特别是对于一些高级的数据操作和分析任务。例如,用户可能需要通过多次拖拉拽和选择操作,才能创建一个复杂的数据仪表板或执行一次复杂的数据分析。对于一些更复杂的需求,例如需要联结多个数据源或需要进行复杂的数据预处理,拖拉拽工具可能无法满足,或者操作起来非常复杂和困难。

最后,尽管拖拉拽工具通常提供了丰富的数据操作和可视化功能,但用户仍需要对数据和数据分析有一定的理解,才能有效地使用这些工具。例如,用户需要知道哪些数据是相关的,哪些数据是可以比较的,哪种图表可以有效地表达某种数据关系等。如果用户对数据分析的基本概念和方法没有足够的理解,他们可能会感到困惑,不知道如何选择和使用这些功能。

因此,拖拉拽的数据分析方式,门槛还是不够低,交互方式还是不够自然。那么什么才是最自然的人机交互方式呢?回想一下,人类平时是用什么交流的?——自然语言。既然人与人之间可以用自然语言交流,那为什么不能用自然语言来进行人机“交流”呢?如果能够实现基于自然语言的数据分析交互,那在易用性上必然会更进一步。


04、基于大模型,构建基于自然语言的数据分析方式

要做好这个事情,关键的有三个方面:基于大语言模型来准确理解用户数据分析需求;联通指标平台来进行数据计算和分析,给出分析结果;打通各个SaaS系统,以分析结果推动业务流程改善,提升管理与经营效率,实现组织协同。

首先,基于大语言模型来准确理解用户数据分析需求。大语言模型如ChatGPT,通过训练大量的文本数据,它们可以理解和生成自然语言,使得人机交互更加自然、便捷。在数据分析场景下,用户可以用自然语言描述他们的数据需求,例如“我想知道上个季度的销售额”或者“请告诉我我们最畅销的产品是什么”。大语言模型可以解析这些需求,转化为可以执行的数据查询和分析任务。这大大降低了数据分析的门槛,让非技术用户也可以轻松地进行数据分析。

其次,联通指标平台进行数据计算和分析。指标平台是一个专门为数据分析设计的系统,它可以处理各种数据,包括结构化和非结构化数据,进行复杂的数据计算和分析。在理解用户需求后,我们需要依赖指标平台来执行具体的数据操作,例如数据查询、筛选、排序、聚合等,并生成分析结果。这一步是数据分析的核心环节,它决定了数据分析的质量和效率。

最后,打通各个SaaS系统,以分析结果推动业务流程改善。数据分析的目标不仅仅是获取数据洞察,更重要的是,根据这些洞察来改善业务流程,提升管理与经营效率。因此,我们需要将数据分析结果反馈到各个业务系统中,例如CRM、ERP等,以支持业务决策和操作。例如,如果我们发现某个产品的销售额下降,我们可以通过CRM系统调整销售策略;如果我们发现某个供应商的供货速度太慢,我们可以通过ERP系统调整采购计划。这样,我们可以实现数据驱动的业务流程改善,提升整个组织的运营效率。


05、大模型与数据分析发展相结合

从当前数据分析的发展趋势来看,我们可以很清楚地感受到大模型的能力是自然而然的与数据分析的发展趋势相应契合,这意味着数据分析是大型模型落地应用中至关重要的场景。

关于大型模型的能力边界,我们通过调研数百家企业用户,发现问题在于企业用户(尤其是IT部门)对于大模型是否可以在哪些场景中落地,还没有明确的认知。实际上,IT部门最后还是服务于业务部门和管理层,因此当后两者对于大型模型在哪些场景下应用没有明确想法时,IT部门去推广大模型就会变得非常困难。

因此,在跟很多企业用户交流时,我们发现他们都非常想知道大型模型在哪些场景下可以应用,而数据分析天然是重要应用场景,这是由整个数据分析市场发展趋势所决定的,具体情况如下:

第一阶段,以静态报表为主,传统BI和静态报表基本上都是面向IT部门的,业务部门提出需求之后,由IT根据报表工具开发出固定的报表,然后业务部门查看报表结果。

第二阶段,我们提到的敏捷BI强调的是自助式分析,这一点实际上是指在业务部门提出需求之后,数据分析师可以基于敏捷BI的工具帮助业务部门快速获取所需的数据,帮助他们获得所需要的结果。

因此,第二阶段的真正服务对象变成了数据部门,也就是数据分析师。这个部门有时在独立的数据分析部门下,有时则在业务部门下设有专门的数据分析师。可以发现,对比第一阶段,第二阶段明显更近了一步。

第三阶段,我们看到的不管是基于大模型的AskBI还是增强分析,都是直接面向业务的,其理念是业务部门直接使用对话式BI工具就能够解决问题,获得所需的数据结果。这一过程无需像之前那样依赖IT部门开发报表,或者数据分析师基于敏捷BI再提供数据结果,而是直接由业务部门推进落地。

因此我们可以看到,在整个数据分析的发展趋势是不断地降低用户的交互门槛,让业务部门更加自如、更加容易地使用分析工具,并实现其自身的效果。

所有数据分析的需求,包括取数和用数需求,本质上都来自于业务部门。但是过去业务部门缺乏能力或者没有好的工具来满足这些需求,因此必须依赖于IT部门、数据部门来实现它们的目标。

而随着BI不断地提升交互的体验,降低用户门槛,最终使业务部门自身具备数据分析的能力,这与大模型的能力天然契合。大模型的生成能力和效力可以比较好地提升用户交互体验,因此我们认为,数据分析一定会是大模型很重要的落地场景。


06、大模型在数据分析场景的落地应用

在调研中我们发现,从趋势上看,像消费品零售、美妆、银行、保险、证券等领域各个头部企业,都在落地实施大模型和数据分析工具的深度融合。

从大模型实际能力的边界来看,它在企业内部的用户落地过程中,大致分为生成类应用、决策类应用和多模态应用这三类。在数据分析场景中,它涉及到生成类应用和决策类应用这两种。

生成类应用

目前,大家谈论的主要是生成类应用主要体现在以下几个方面:

第一,对话式交互,这也是最常见的应用体现,即通过自然语言取代原来拖拉的方式并自动完成整个数据分析和相关报表的生成。

第二,内容生成,就是自动地生成分析报告和相关报表。

第三,代码开发,这项应用在数据分析中非常重要,其中之一是编写SQL查询语句以查看底层宽表的数据。因此,大型模型本身可以自动地生成SQL查询语句。

第四,智能体,也就是大模型本身可以去做任务的分解。例如,你需要查询利润率,那利润率可能本身是由营收减成本来计算的,那么大模型其实要去做任务的分解和指标的分解。

下一步将讲解如何实现这两个方面的需求,即经营决策的应用场景以及实现路径。


07、大模型+指标平台的实现路径

从目前看到的情况来看,决策首先需要的是确保准确性,要确保每次交互获取的数据是准确的,因此不能让大模型过于天马行空地查询数据。因此,我们通常采用的实现路径之一是直接调用GPT,结合用户输入的自然语言,使用大型模型的通用算法和功能来识别和理解用户意图,以更精准地命中关键词。

当命中关键词后会在指标平台上进行查询,这个查询过程非常严格,只能在指标平台上进行,这可以确保最终的结果一定会与指标平台中的具体指标相关。查询完成后,大模型会自动生成一段分析报告的语句,而不仅仅是简单地提供数据结果或表格,这样做可以让用户体验更加顺畅。

与此同时,大模型本身也可以解读这些数据,并给出初步的一些建议。例如,哪些指标在最近两个月内显著增长或发生了变化,需要特别关注哪些指标,而且当使用GPT3.5或GPT4时这个过程就会非常简单,不需要进行预训练。

我们现在看到,通过fine-tuning微调可以很好地发挥模型的理解能力。根据我们的调研结果,这种微调所需的数据量最多不超过1万条,通常只需要几千条就足够好训练出结果了,这是一类使用GPT的方法。

如果需要进行私有部署,使用6B、7B或13B的模型就可以很好地实现以上效果。无论是进行fine-tuning还是进行简单的预训练,都可以实现接近GPT3.5的效果。因为最终的查询是针对指标进行限定,这是一个相对较小的范围,而且整个推理的成本也不高。


08、存在的问题与未来的探索

需要指出的是,尽管基于大模型的自然语言交互方式在理解用户数据分析需求方面已经展现出了强大的潜力,但变革才刚刚开始,我们还需要努力解决一些挑战,不断提升能力和用户体验。

例如,需要优化大模型与指标平台、数据分析平台的对接方式。大模型理解并生成的是自然语言,而指标平台通常接受的是具体的数据查询和操作指令。我们需要一个转换器,将大模型的输出转化为指标平台可以理解和执行的指令。这可能涉及到一些技术难题,如自然语言到SQL的转换,以及如何将复杂的数据分析需求分解为一系列可以执行的数据操作。

此外,大模型的准确性和稳定性也是一大挑战。虽然大模型可以理解和生成自然语言,但是在一些复杂和模糊的场景下,它的理解可能并不准确,或者产生的结果可能有多种可能。我们需要提供足够的反馈机制,以及在必要时提供人工干预,确保数据分析的结果准确和可靠。而且,数据分析通常涉及到大量的敏感数据,如用户信息、交易数据等,我们需要确保大模型在处理这些数据时,可以充分保护数据的安全和用户的隐私。

当然,虽然还存在一些挑战,但这条路有异常广阔的应用前景。将大模型与指标平台和数据分析平台融合,实现以自然语言进行数据分析,是数据科技领域的一次重大创新,它将深刻改变数据分析的面貌,推动各行业的数字化转型,带来广泛而深远的影响。

对于个人而言,将大大降低数据分析门槛,提升分析效率。传统的数据分析需要学习和理解复杂的查询语言和工具,而基于自然语言的数据分析只需要用户用他们熟悉的语言描述他们的需求。这意味着任何人,无论他们的技术背景如何,都可以进行数据分析,实现真正的普惠数据分析。其次,这将显著提高数据分析的效率和效果。传统的数据分析往往需要大量的数据操作和计算,而基于自然语言的数据分析可以直接从用户需求出发,自动进行数据查询和分析,提供直接的数据洞察。这使得数据分析更加快速和准确,更能满足用户的实际需求。

对于企业而言,将加快决策速度和精准度,提升经营管理效率和业务创新能力。自然语言的交互方式,大大加快数据分析的速度,使得决策者可以更快地得到数据洞察,更快地做出决策。而且,基于大模型的自然语言理解,可以处理复杂的数据分析需求,如比较分析、因果分析、预测分析等。这将大大增强数据分析的深度和精度,使得决策者可以得到更深入、更准确的数据洞察,做出更好的决策。管理者不仅可以快速获取业务洞察,还可以根据洞察调整业务流程,甚至是与其他SaaS系统的集成,这将极大地提高企业的业务效率和运营效率。数据分析是数字化转型的关键环节,它可以帮助企业理解和利用他们的数据,创新产品和服务。

对于社会而言,将推动社会数字化转型。基于自然语言的数据分析,可以让更多的企业和个人参与到数据分析中来,进一步推动各行业的数字化转型。数据分析可以帮助我们理解和解决各种社会问题,如公共卫生、环境保护、教育公平等。基于自然语言的数据分析,可以让更多的人参与到这些工作中来,共同推动社会的进步。可以预见,随着数据分析的普及和深入,社会将有更多的机会发现新的业务模式、新的市场机会、新的社会需求。

想象一下,当这种数据分析方式大规模推广后,我们将会看到一个全新的数据分析生态。在这个生态中,任何人都可以轻松地进行数据分析,找到他们需要的答案和洞察。各行各业都可以充分利用他们的数据,优化业务,提高效率,创新产品。我们的社会也会因此变得更加公正、更加高效、更加创新。这将是一个美好的未来,值得我们共同期待和努力。



1.如转载稿涉及版权问题,请作者联系我们修改或删除相关文章。

2.凡来源为智慧零售与餐饮的内容,其版权均属北京树诚文化传媒有限公司所有。文章内容系作者个人观点,不代表智慧零售与餐饮对观点赞同或支持。

同类文章
  • 相约金秋|第十六届中国商业信息化行业大会暨智慧商业信息化展览会10月23日长沙启幕,共探破卷之路

    相约金秋|第十六届中国商业信息化行业大会暨智···

  • 嘉宾精华|2024智慧商业信息化、数字化、智能化高峰论坛回顾

    嘉宾精华|2024智慧商业信息化、数字化、智···

  • 坚守与变革| 第十六届智慧商业信息化行业大会暨展览会在湘落幕

    坚守与变革| 第十六届智慧商业信息化行业大会···

  • 共聚湘江|2024智慧商业数智化行业峰会暨零售CIO俱乐部秋季思享会10月23日长沙启幕,你报名了吗?

    共聚湘江|2024智慧商业数智化行业峰会暨零···