Day: July 13, 2024

深度递归Q学习用于部分可观测马尔可夫决策过程深度递归Q学习用于部分可观测马尔可夫决策过程

1. 引言 深度强化学习在复杂任务中已经取得了很好的效果。然而,现有的深度Q网络(DQN)存在以下局限性: 1) 记忆能力有限,只能利用最近几帧的信息。2) 依赖于在每个决策点能够观察到完整的游戏画面。 为了解决这些问题,本文提出了深度递归Q网络(DRQN),通过在DQN中加入长短期记忆(LSTM)来处理部分可观测的环境。 2. 深度Q学习 Q学习是一种用于估计长期回报的无模型离线策略算法。传统Q学习需要维护一个状态-动作值表,而深度Q学习使用神经网络来近似Q值函数: $$Q(s, a|\theta) \approx Q^*(s,a)$$ 其中$\theta$是网络参数。训练时使用均方误差损失: $$L(\theta) = \mathbb{E}[(r + \gamma \max_{a’} Q(s’, a’|\theta^-) – Q(s,a|\theta))^2]$$ 为了稳定训练,DQN采用了经验回放和目标网络等技巧。 3. 部分可观测性 在实际环境中,智能体往往无法获得完整的系统状态信息,这就导致了部分可观测马尔可夫决策过程(POMDP)。POMDP可以用一个6元组$(S,A,P,R,\Omega,O)$描述,其中$\Omega$是观测空间,$O$是观测函数。 标准的DQN无法有效处理POMDP,因为它直接从观测估计Q值:$Q(o,a|\theta) [...]

李四强冤案:一场迟来的正义李四强冤案:一场迟来的正义

李四强案件的平反是中国司法系统不断进步的一个缩影。这个案件不仅揭示了司法程序中存在的问题,也为我们提供了反思和改进的机会。让我们深入探讨这个案件的来龙去脉,以及它对我国司法体系的启示。 案件背景 2007年,智力残疾的李四强在南京打工时被警方误认为他人而抓捕。随后,他被广东省汕头市龙湖区人民法院以抢劫罪判刑。2016年出狱后不久,李四强病逝。他的兄长李奎星坚信弟弟被错抓错判,多年来一直为其申诉。 无罪判决的关键理由 2024年4月19日,广东省潮州市湘桥区人民法院对李四强抢劫再审一案进行公开宣判,宣告李四强无罪。判决书中详细阐述了改判无罪的理由: 1. 同案人供述不可信 原审裁判认定李四强参与抢劫所依据的同案人供述经查证不属实。这意味着之前用来定罪的关键证据已经失去了可信度。 2. 李四强认罪供述存疑 李四强的认罪供述存在多处疑点,无法予以认定。判决书中指出,李四强供述原判认定的六宗抢劫事实不排除指供、诱供可能。这一点引发了对办案过程中是否存在违法取证的质疑。 3. 辨认程序违规 法院认定,办案过程中对李四强的辨认以及李四强对同案人的辨认均违反了相关规定。具体来说: 这些做法均不符合《公安机关办理刑事案件程序规定》中”对犯罪嫌疑人照片进行辨认的,不得少于十人的照片”的要求。因此,这些辨认结果依法不予认定。 4. 无顶罪或包庇证据 判决书明确指出,没有证据证明李四强存在为人顶罪或包庇他人的情况。通过对案件相关人员和机构的调查,未发现李四强有这方面的行为。 5. 程序违法 法院认定,原审裁定以更正身份信息的方式确认李四强刑事责任的做法违反了法定程序。根据刑事诉讼法,未经人民法院依法判决,不得确定任何人有罪。在发现原判决”刘西文”并非真正的刘西文时,案件的犯罪事实和证据已发生实质性变化,应当通过审判监督程序重新审判。 案件反思与启示 1. 强化程序正义 李四强案件中,多处程序性错误导致了错误判决的产生。这提醒我们,在司法实践中必须严格遵守法定程序,不能为了追求效率而忽视程序正义。 2. 提高证据标准 本案中,同案人供述和被告人供述都存在问题,这凸显了提高证据采信标准的重要性。在刑事案件中,应该坚持”疑罪从无”原则,只有确凿的证据才能作为定罪依据。 3. 完善辨认制度 [...]

罐车运输乱象调查:食品安全风险隐患罐车运输乱象调查:食品安全风险隐患

近年来,罐车运输行业的一些乱象引发了社会的广泛关注。一项调查揭示了食用油运输过程中存在的严重问题,这不仅涉及运输企业的诚信问题,更关乎广大消费者的食品安全。让我们深入探讨这一问题,剖析其中的原因,并思考可能的解决方案。 混装运输:食用油与化工液体同车而行 调查发现,许多普货罐车在运输过程中存在严重的混装问题。这些罐车不仅承接糖浆、大豆油等可食用液体,还会运送煤制油等化工类液体。更令人担忧的是,在切换货物时,许多罐车甚至不进行清洗。 案例分析 一位名叫邱健的罐车司机透露:”散装食用油在长距离运输过程中其实属于半脱管的状态,卖油的厂家不怎么管,买油的公司不知情,让运输公司钻了空子。” 记者实地跟踪调查发现: 这一案例清晰地展示了食用油与化工液体混装运输的现状。这种做法严重威胁食品安全,可能导致食用油被残留的化工液体污染。 成本压力:罐车运输行业的困境 运费下降带来的压力 近年来,由于罐车数量增多,竞争加剧,罐车运输价格大幅下降。一名罐车司机透露:”以天津到西安为例,最早单程运费报价都在每吨400元以上,现在降到200元左右。” 这种价格压力迫使许多罐车不得不在返程时寻找配货机会,以提高运营效率。在这样的情况下,许多罐车将目光投向了煤制油运输。 清洗成本成为负担 洗罐成本也是罐车运营中的一大支出。据了解,单次洗罐的成本在300-900元不等。为了节省这笔开支,许多罐车选择在换货运输时不进行清洗。 一名罐车司机表示:”老板让清就清,老板不让清就不清,老板的事。”这反映出,在经济压力下,一些运输公司为了降低成本,不惜牺牲食品安全。 监管缺失:食用油厂家把关不严 调查发现,许多食用油厂家在验收罐车时存在严重疏漏,验罐程序往往流于形式。 案例分析 这些案例反映出,一些食用油厂家在把关方面存在严重不足,为混装运输提供了可乘之机。 法规缺失:现有标准约束力不足 目前,我国在食用油运输方面缺乏强制性的国家标准。现有的《GB/T30354-2013食用植物油散装运输规范》仅为推荐性标准,对企业的约束力有限。 江南大学食品学院王兴国教授指出:”它也是一项国家标准,相关企业在制订企业标准时,要以这个为依据,企业标准可以比这个标准更严格,一般来说不能低于这个标准。” 然而,由于缺乏强制性,许多企业在执行过程中存在松懈现象。 健康风险:化工残留对人体的潜在危害 中国农业大学食品学院副教授朱毅警告:”混用又不清洗,残留物势必会对食用油造成一定的污染,运输食用油应该专车专用。”她进一步解释,煤制油中含有的不饱和烃、芳香族烃、硫化物等成分可能影响人体健康,甚至导致中毒。 这一警告凸显了混装运输对公众健康构成的潜在威胁,亟需相关部门和企业予以重视。 解决之道:多方共同努力 针对罐车运输行业存在的问题,需要多方面共同努力: 结语 罐车运输乱象不仅反映了行业管理的漏洞,更暴露了我国食品安全领域存在的潜在风险。解决这一问题需要政府、企业和社会各界的共同努力。只有建立健全的监管体系,提高企业责任意识,加强社会监督,才能从根本上保障食品安全,维护消费者权益。 参考文献 [...]

调查记者韩福涛:卧底多年,我很快乐调查记者韩福涛:卧底多年,我很快乐

调查记者是新闻行业中一个特殊而又重要的群体。他们深入社会的各个角落,揭露不为人知的真相,为公众利益发声。本文将聚焦于资深调查记者韩福涛的从业经历,探讨这一职业的魅力与挑战。 一、从”胖哥俩”事件看调查记者的工作方式 2021年8月,韩福涛的一篇关于”胖哥俩肉蟹煲”的调查报道引发广泛关注。这篇报道揭露了该连锁餐厅存在使用隔夜死蟹、腐烂食材等严重的食品安全问题。那么,韩福涛是如何完成这次调查的呢? 1. 线索来源与选题判断 韩福涛接到这个选题的初始线索来自一位消费者的投诉。这位消费者带孩子在”胖哥俩”用餐后全家吃坏肚子,但维权未果。一般来说,单个消费者的投诉很难成为一个有影响力的调查报道。但韩福涛敏锐地发现了这背后可能存在的系统性问题。 他说:”那个消费者当时吃坏肚子之后,上’大众点评’看’胖哥俩’的评价,把北京10多家店的全部评价给梳理了一遍,重点看负面评价,发现很多人跟他有相同的经历。” 这份汇总了几百个差评的Excel表格,成为了韩福涛决定深入调查的关键依据。他意识到这不是个案,而可能是整个企业在食品安全方面存在严重问题。 2. 卧底调查的实施 为了获得第一手资料,韩福涛决定采用卧底的方式进行调查。他说:”食品安全问题只有在后厨才能知道最真实的情况。” 韩福涛先后在两家”胖哥俩”门店成功应聘为切配工,分别是朝阳区合生汇店和北京凯德MALL大峡谷店。在卧底期间,他亲身经历并记录了以下问题: 3. 报道发布与后续影响 2021年8月23日上午8:13,韩福涛的调查报道正式发布。报道引发了广泛关注和讨论: 至此,相关话题的微博阅读量突破10亿。这次调查报道不仅揭露了严重的食品安全问题,还推动了相关部门的监管行动,对保护消费者权益起到了积极作用。 二、调查记者的职业挑战 1. 心理压力与成果不确定性 韩福涛坦言,做调查记者并非易事。他说:”太聪明的人干不了调查记者。”在”胖哥俩”事件中,他每时每刻都在怀疑自己的选择:”我为什么想不开,来做这个选题?看不到成果,不知道能不能出稿,如果做不成,没有任何稿费,做再多都白干。” 这种心理压力源于调查记者工作的特殊性: 2. 公共利益与个人情感的矛盾 2016年,韩福涛参与报道了”常熟童工”事件,揭露了江苏常熟服装厂非法雇佣童工的现象。在调查过程中,他以工人身份卧底进入工厂,结识了一名15岁的童工小熊。 通过与小熊的交往,韩福涛了解到童工们的真实处境: 报道发布后,虽然推动了政府对童工问题的整治,但小熊却因此知道了韩福涛的真实身份。小熊感到被欺骗,拒绝再与韩福涛联系,甚至将他拉黑。 这种情况让韩福涛陷入了道德困境。他说:”从个人层面来说,我骗了他,这确实是我的不对,当时的他只是一个十五岁的小孩子。但是我真的是为了更多孩子能不要重蹈他的覆辙,我只能从大局考虑。” 当被问及如何平衡私人情感与公共利益时,韩福涛哽咽了,停了一会儿,说:”没法平衡。” 这种矛盾是许多调查记者面临的普遍问题。他们必须在揭露真相、推动社会进步与维护个人关系之间做出艰难的选择。 3. [...]

假驴肉产业链调查:母猪肉变身驴肉,添加剂超标催生致癌物假驴肉产业链调查:母猪肉变身驴肉,添加剂超标催生致癌物

在这个追求美食的时代,驴肉以其独特的口感和营养价值,成为了许多消费者青睐的选择。然而,一场席卷全国的假驴肉风波,正在动摇消费者对这一美食的信心。本文将深入探讨假驴肉产业链的运作模式、潜在的健康风险,以及这一现象背后的社会经济因素。让我们一起揭开假驴肉产业的神秘面纱。 1. 假驴肉产业链的形成与扩散 1.1 假驴肉的源头:长丰镇的隐秘作坊 在河北省任丘市长丰镇,一个不为人知的假驴肉生产基地正在悄然运作。新京报记者的调查揭示,这里有多达四五十家假驴肉生产作坊,它们隐藏在普通民居中,外表平平无奇,内里却暗藏玄机。 这些作坊通常规模不大,但生产效率惊人。以一家作坊为例,每天能加工出1600斤”驴肉”。然而,这些所谓的”驴肉”实际上是由廉价的母猪肉或马肉加工而成。 1.2 原料来源:老母猪肉的”华丽转身” 假驴肉的主要原料是被称为”2号肉”的老母猪前腿肉。这种肉来自已经繁殖多年、被养殖场淘汰的老母猪。由于肉质较老,纤维粗糙,口感接近大型牲畜的肉,成为制作假驴肉的理想选择。 记者在调查中发现,这些老母猪肉主要来自吉林长春和山东临沂等地。仅长春一家猪肉分割市场的批发商,每年就向长丰镇供应约500吨老母猪肉。 1.3 加工过程:添加剂的”魔法” 将老母猪肉或马肉变成”驴肉”的关键在于添加剂的使用。主要添加剂包括: 这些添加剂的使用,使得廉价的母猪肉在外观和味道上都更接近真正的驴肉。 1.4 销售网络:遍布全国的假驴肉 假驴肉的销售网络已经遍及全国各地。长丰镇的假驴肉通过多种渠道销往各地: 2. 假驴肉的健康风险 2.1 亚硝酸钠超标问题 亚硝酸钠是假驴肉生产中常用的添加剂,主要用于上色和防腐。然而,记者调查发现,许多作坊在使用亚硝酸钠时严重超标。 根据国家标准,酱卤肉制品每公斤亚硝酸钠残留量应不超过30毫克。但记者送检的样品中,亚硝酸钠残留量最高达到110毫克/公斤,超标2.6倍以上。 2.2 亚硝酸钠过量的健康危害 2.3 其他潜在风险 除了亚硝酸钠超标问题,假驴肉的生产过程中还存在其他潜在风险: 3. [...]