【理响中国|铿锵有理·党校公开课】解码新时代十年伟大变革******
编者按:为深入学习宣传贯彻党的二十大精神,在中央网信办网络传播局的指导下,光明网联合中央党校(国家行政学院)习近平新时代中国特色社会主义思想研究中心、中央党校(国家行政学院)国家高端智库,推出“理响中国之铿锵有理·党校公开课第五季”专题视频。13位党校教师以独特的青年视角,通过深入浅出的理论阐释、生动鲜活的理论故事和“高颜值”的理论视频,推动广大青年与党的创新理论“共情”,打造学习宣传贯彻党的二十大精神的精品力作。
本期由中央党校(国家行政学院)中共党史教研部付吉佐,解码新时代十年历史性成就和伟大变革。
【文字实录】
从2012年到2022年,十年间,我们的国家和社会都发生了很大的变化。习近平总书记在党的二十大报告中,提到了16个方面的成就。这些成就,体现在我们日常生活的方方面面。大家都有哪些体会呢?我来分享一下我的体会。
2012年,我刚好大学本科毕业。那一年,我开始特别关注一个反映空气质量的指标,叫“PM2.5”。这个数值越高,说明空气质量越差。2013年1月15日,有媒体发布监测数据说,在全国74个监测城市中,有33个城市的PM2.5指数,都超过了300,这意味着,这些城市的空气,已经严重污染了。
2013年,我们开始了一系列延续至今的铁腕治污行动。效果呢,也是肉眼可见的,现在我们的天变得更蓝了、我们的山变得更绿了、我们的水变得更清了。拿我生活所在的城市北京来说,它曾经饱受雾霾之苦,有时难得出现一个蓝天白云的好天气,朋友们就会发朋友圈、晒美图。而现在,蓝天白云已是标配,曾经的奢侈品成为了日常品。我们国家生态环境领域发生的这些重大变化,也受到了国际社会的广泛关注。比如,美国彭博新闻社报道说,从2013年到2020年这7年,中国的空气质量改善幅度,相当于美国《清洁空气法案》实施30多年的改善幅度。
这十年,我感受最深的,是我从北京回老家,变得更快捷、更方便了。之前我乘坐的是K字头的绿皮火车,后来变成D字头的动车,再后来变成G字头的高铁。回老家的时间,也由最初的8小时,缩短到5小时,而后又缩短到3小时。现在,我早晨从北京出发,中午就可以回到家,吃上一碗妈妈包的热气腾腾的饺子。为什么会这样呢?因为我们建成了世界上最大的高速铁路网和高速公路网。遥想100多年前,革命先驱孙中山先生在他的《建国方略》中,曾经设想,建成16万公里的铁路和160万公里的公路,而如今,他的梦想已经被实现甚至被超越。截至到2020年,我国铁路营业里程已达15万余公里,其中高铁4万余公里,居世界第一;我国公路通车里程已达510万公里,其中高速公路15.5万公里,居世界第一。
这十年,我们在创新型国家建设方面也取得了很大的成就。我是一位航天爱好者,在工作之余还特别关注航天科技领域的发展情况。我大学毕业那会儿,中国刚刚实现奔月的目标,但是没有丝毫停歇,中国就决心自主开展火星探测。2016年,中国首次火星探测任务——“天问一号”获批立项,用了不到4年时间,便完成了探测器研制。2020年7月,天问一号发射成功,9个月后,成功着陆火星、开展巡视。通过一次任务就完成对火星的环绕、着陆和巡视三大目标,这在人类航天史上,是第一次。而且这十年,我们在电视上看到火箭升空的画面也明显增多了,那一次次的“点火”声,激动人心、震撼人心。从2020年5月到2022年8月,长征火箭连续103次发射成功。其中2021年中国航天发射任务55次,居世界第一。
这十年,我们的生活更便利了。记得上大学那会儿,我买书、买生活用品,还需要到实体店选购;而现在呢,我只需要在手机上下单,第二天就可以收到货物。这是十年前的我们所享受不到的便利。
这十年的成就,还有很多很多,比如说:我们国家的经济实力更强了,国内生产总值从54万亿元增长到114万亿元,经济总量稳居世界第二;我们的行政办事效率更高了,一大批行政审批事项被取消;我们的政治生态更清正了,一些歪风邪气、沉疴顽疾得到整治,反腐败斗争取得压倒性胜利并全面巩固;我们老百姓的医疗保障更好了、寿命更长了,人均预期寿命从74.8岁增长到78.2岁;同时,我们在国际上的朋友更多了,在国际上的话语权更大了,在国际上的地位更重要了。
总之,新时代十年的伟大成就,让我们更加自信了,让我们有了更多平视世界的底气,也让我们坚信,我们未来的生活会更加美好。
古人说:“看似寻常最奇崛,成如容易却艰辛。”什么意思呢?意思是说,看似最寻常的发展变化,背后却需要付出极其艰辛的努力。新时代这十年,正值中华民族伟大复兴战略全局与世界百年未有之大变局的交汇,面临的风险和挑战,可以说是前所未有的。比如说,在国际方面,“逆全球化”思潮愈演愈烈,“贸易保护主义”再次抬头,一些西方国家鼓吹与中国脱钩,并对中国进行讹诈、封锁和极限施压。在国内方面,中国的改革进入攻坚期、深水区,“好吃的肉都吃完了,剩下的都是难啃的硬骨头”,涉及到更多利益的调整和更深层次的矛盾。
所以说,新时代十年的伟大变革,决不是轻轻松松、敲锣打鼓就能实现的。那是因为,有以习近平同志为核心的党中央凝心聚力、审时度势、果敢抉择,团结带领全国各族人民撸起袖子加油干,对内全面加强党的领导和全面从严治党,以巨大的政治勇气深化改革,推进国家治理体系和治理能力现代化;对外全面推进中国特色大国外交,推动构建人类命运共同体,更加坚定地维护国家主权、安全和领土完整。中国这艘巍巍巨轮,更加行稳致远!
极不寻常、极不平凡的十年刚刚走过,新的历史任务已经到来了。习近平总书记在党的二十大报告中指出,“从现在起,中国共产党的中心任务就是团结带领全国各族人民全面建成社会主义现代化强国、实现第二个百年奋斗目标,以中国式现代化全面推进中华民族伟大复兴”。苏轼有句词说得好,叫“一点浩然气,千里快哉风”。我们相信,中国共产党用伟大奋斗创造了百年伟业,也一定能用新的伟大奋斗创造新的伟业。
出品人:杨谷 林振义
总策划:陈建栋 孙晓莉
总监制:吴丛丛 黄伟
策划:蒋正翔 施墨
监制:张晞 李澍
统筹:韩丹 桑熙 陈航
编辑:徐倩阳 刘梦甜
编导:路天悦 梁爽 常世林
设计:王爱民 杨经国
中央网信办网络传播局指导
中国互联网发展基金会支持
中央党校(国家行政学院)习近平新时代中国特色社会主义思想研究中心、中央党校(国家行政学院)国家高端智库、光明网联合出品
向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
(文图:赵筱尘 巫邓炎)