“文生数”改变了大数据的开发模式 ——来自资深IT工程师的心声

点赞 0
评论 0
收藏


作为一个从业超过20年的大数据平台研发负责人,我管理的企业级海量大数据平台历经十多年的持续建设,数据仓库沉淀了几十万数据表,每日数据作业任务数超过60万个,支撑了万余个指标及千余张报表的数据服务。为了确保该平台的运行,我们投入大量的数据开发工程师和运维工程师。经统计,我们的大数据工程师每日要敲击上万次键盘和鼠标,机械性的工作已经不堪重负,但大数据相关的开发需求仍然在呈指数级的速度增长。


我完整的经历了以“代码开发”为主的大数据平台1.0时代,以及以“低代码配置化”为主的大数据平台2.0时代。在智能化新时代汹涌而来的今天,不禁重新审视我们的大数据体系:

我们应用了近30年的基于经验的数仓分层体系能否适应智能时代?

传统的基于IT视角的数据呈现与信息获取方式还能满足智能时代的需求吗?

以代码、映射、调度、流程配置为主的数据管理模式是否足够高效?

大数据集群人工经验+监控预警+事后修复的运维模式,是否能适应当前海量大数据应用?


直到人工智能技术的快速发展和大规模应用,对大数据平台进行智能化升级,智能大数据平台能够全面实现数据的自动采集、智能建模、智能分层、依需自动生成数据图谱,并对外提供智能数据服务,我明白基于人工智能的大数据平台3.0时代到来了!



大数据+人工智能让我从开发、应用、运维、管理四个方面感受到数智化的魅力:


一、在大数据开发方面的各个环节,它显著提升我和我的团队的工作效率
数据采集 环节,传统的开发模式采集一份数据,总代码数167行、其中模版化87行、点击配置操作68次、开发周期3天。采用智能采集后,可以实现零代码开发,优化后为点击配置操作23次,开发周期1天,工作效率实现66%的提升。
数据建模环节,传统建模方式需要大量的梳理工作以及重复性配置操作,通过智能大数据平台建模,将传统利用ETL工具重复性、模板化的建模工作实现智能化,将我的建模效率从平均耗时2.6小时提升为1.1小时,效率提升57%。
数据加工环节,传统的数据开发中,需求业务分析、技术口径定义以及脚本开发修改主要依赖人工。智能大数据平台则在业务需求分析,技术口径定义上协助人工分析判断提高45%工作效率,释放人力更专注于业务创新。智能化创建数据开发模板,提高67%以上工作效率,缩短建设周期,减少人力的重复配置操作。

数据分层环节,基于AI能力,进行智能场景分层判断,匹配专家知识,以数据接口和结果表为基础,识别数据的结构特征,根据实际需求进行调整,通过迭代逐步完善分层逻辑,输出数据分层方案。通过智能分层,工作效率较过去提升56%,数据存储下降54%。


二、在数据应用方面,我也体会到了智能给我带来的便捷工作效率提升了80%,将节省的时间和精力用于业务思考。
经营分析:改变了现有菜单式点选选择数据的模式,根据用户的职位、角色和权限智能聚合生成用户感兴趣的数据,并通过多种形式展现。通过自然语言的模式与用户多轮对话刷新数据和展示模式,实现层层递进的深入分析。
营销系统:借助AI大数据能力,基于业务经验总结,从客群洞察、策略推荐、智能反馈等方面注入智能能力,将数据转化为生产力,赋能数字化智能营销,运营效率可提升83%。
业务受理:提供专业的话术模板和领先的FAQ语义算法能力,快速定位并解决我的业务问题,改变功能罗列式的受理模式,根据用户特征和需求应用实现智能精准服务。

客户服务:利用行业数据及多年积累的客服知识库,训练行业大语言模型,结合智能客服管理平台灵活配置客服机器人,让“客服”更懂意图,服务更有温度。


三、在大数据运维方面,我通过智能运维建立智能化运维知识图谱及智能分析主动运维,面向通用运维场景提供智能化异常洞察和自我决策自愈等能力,辅助我快速精准的处理频发的、日常的生产隐患。对故障进行质量监测、数据生产及平台监控、根因诊断、故障自愈、方案推荐等,减少63%的运维工作量,降低系统运维压力,使我有更多的时间处理疑难杂症。


四、在数据管理方面, 我可以利用大模型对海量的数据、文本、图片、视频、音频等进行数据标注管理、数据资产管理、数据服务管理、数据安全管理,相同工作时间内可提升74%的工作量。
在流程配置环节 为我开展数据管理工作提供规范化的流程配置指导,简化、规范日常的数据流程配置工作,提高工作效率,减少无效与冗余工作。我进行流程配置平均耗时8小时,通过幕僚智数实现平均耗时4.3小时,效率提升46%。
在数据图谱上 传统血缘体系存在血缘识别率低,质量差、血缘链路属性展现不健全,实用性差等问题。智能大数据平台通过强化血缘提取工具、解析工具,将血缘、质量、监控、数据加工等能力整合,构建“智能、完整、多维、易用”的可视化血缘体系,能够节省80%以上的人工成本。

在数据服务环节传统数据服务模式下,我的工作手工操作步骤多,多次填写、提交信息,过程复杂。现在利用智能大数据平台生成服务发布、配置数据、智能推荐、服务订阅,人工操作从至少71次提升为只需10次,为我减少86%工作量,提升服务效率。


通过几个月的使用情况来看,智能大数据平台与传统数据平台相比具备“基于大模型驱动”、“面向用户的无边界感操作”及“仅需要通过业务语言输入”三大变革,整体上可大幅缩减数据开发人员60%的工作量投入、减少50%的代码工作及50%的配置化工作,减少40%以上存储空间,大幅的降低了我的团队重复和机械性重复工作,把我从繁重的日常事务性工作中解脱出来,能有足够的时间思考和规划未来的发展方向,使我真正体会到了大数据+人工智能对传统大数据行业颠覆性的意义。


郑重声明:用户在社区发表的所有信息将由本网站记录保存,仅代表作者个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
    --
    总收益 20日收益 日收益
    -- -- --
    最新操作
    - - -
    历史收益率走势(%)
    Chart
    代码 名称 最新价 涨跌幅
    查看更多
    浪客视频
    -
    郑重声明:东方财富网发布此信息的目的在于传播更多信息,与本站立场无关。东方财富网不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担。
    信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
    沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500