摘 要:多旋翼无人机在低空的应用场景越来越多,而在复杂的实际环境中实现无人机自主飞行面临诸多挑战。本文介绍了无人机自主飞行系统各模块相关研究的基本原理、代表方法和前沿研究,主要包括用于环境障碍感知的实时地图构建技术、离散空间的路径规划、连续空间中的轨迹优化以及强化学习中的仿真—现实差距。最后,本文总结了自主飞行领域尚未有效解决的问题,对未来的研究趋势进行展望。
摘 要: 目前, 自动驾驶场景下基于深度学习的语义分割模型在对抗攻击下的鲁棒性评估研究较少。已有研究存在两点局限: 测试所用的对抗样本类型有限; 评估的语义分割模型覆盖面较窄。这制约了对语义分割模型鲁棒性的全面认知, 因此本文从模型结构的内部因素与数据层面环境扰动的外部因素出发, 进行了语义分割模型的鲁棒性分析。本文选取采用不同骨干网络的五类典型语义分割模型为研究对象, 分别在白盒攻击与黑盒攻击范式下, 通过实验对各语义分割模型的鲁棒性进行定性与定量分析。最终得出四条有价值的结论。
摘 要:实时检测低空无人机对于保护个人隐私和防范非法入侵至关重要。为此,我们提出无人机检测算法AU-YOLO。在YOLOv11基础上引入MSES模块以增强网络的边缘提取能力。此外,我们借鉴C2PSA架构,开发了DMTSA模块,对高层特征进行细化以缓解传统注意力机制在处理输入数据动态变化时鲁棒性不足的问题。最后,在Anti-UAV数据集上的实验表明:AU-YOLO在精确率(P)、召回率(R)、平均精度均值(mAP 50)指标上分别较原始模型提升了0.90%、1.10%、1.08%,并且在计算资源和参数量上仅分别增加了0.5 GFLOPS、0.079 Million,验证了这些改进方案的有效性,为低空无人机检测提供了有效解决方案。
摘 要:针对蓝藻水华浓度渐变的边界特性,本文提出面向渐变边界的自适应边缘感知损失函数,引入高斯衰减和可调宽度参数θ,使损失函数适配典型过渡带宽度。为验证该损失函数的条件有效性与适用性,基于无人机遥感航拍影像,在CNN(U-Net)、Transformer(SegFormer)和视觉基础模型(SAM2)三类典型架构上进行对比实验。实验结果表明:Edge-Aware Loss对不同架构呈现出条件有效性,它在冻结编码器的SAM2上性能显著提升,但对全训练的U-Net和SegFormer反而效果不佳。在316张训练图像的小样本条件下,本文提出的SAM2+Edge-Aware Loss+数据增强方案在无人机遥感蓝藻水华分割任务中达到66.54% IoU和62.10% Boundary IoU;同时SegFormer+Dice Loss在全参数训练场景下达到最优性能79.56% IoU。该方案构建了面向渐变边界分割的无人机航拍蓝藻水华标准化评测基准,包含完整的数据集、评测协议和多基线对比,为小样本条件下有效建模蓝藻模糊边界的研究提供参考,也为损失函数条件有效性的设计与应用提供了实践依据。 关键词:蓝藻水华分割;边缘感知损失函数;SAM2;多架构对比;无人机遥感
摘 要:随着人工智能与水下机器人技术的发展,智慧渔业和精准养殖等理念兴起,推动了面向海洋科研与可持续渔业的水下鱼类检测需求。然而,受复杂水下环境、鱼群密集且目标小、种类繁多等因素影响,水下目标检测任务仍具挑战性。为此,本文提出一种融合Transformer注意力机制的轻量级YOLOv8s水下鱼类检测模型:通过Transformer捕获图像全局上下文信息,改进PAN网络结构以提升小目标检测能力,并引入ASFF模块应对鱼类尺度差异。模型在融合DeepFish与OzFish两个公开数据集构建的数据集上训练与测试,结果表明,其性能优于原始YOLOv8s及其他先进检测网络,mAP达83.2%,兼具轻量化与低计算成本,适用于水下机器人平台的海洋鱼类探测任务。
摘 要:在建筑安防领域,快速、准确地检测施工人员是否穿戴安全设备至关重要。不同类型的安全设备具有不同尺度、不同位置的特征信息,为避免复杂环境干扰导致误检和漏检,本研究提出了一种基于改进YOLOv11的安全设备检测算法AKSS-YOLO。首先引入AKConv模块,增强模型对不同尺度特征的提取能力;然后引入SHSA注意力机制,在聚焦重要特征的同时降低计算消耗;最后利用SLS损失解决模型对不同尺寸、不同定位目标不敏感的问题,提升模型准确率。公开数据集上的实验结果表明,AKSS-YOLO相较于基准模型在mAP@50、mAP@50:95上分别提高了1.3%和4.8%,且具备更小的计算量和模型参数量,验证了改进算法的有效性和实用性。
摘 要:在复杂交通场景中,交通标志实时检测易受遮挡、尺度变化、光照突变等因素干扰,本文提出一种基于改进YOLOv8n的复杂场景交通标志实时检测系统。通过重构特征提取网络、优化特征融合机制、采用DIoU-NMS后处理算法,有效提升了系统在复杂环境下的检测鲁棒性。基于公开数据集TT100K、自制复杂场景数据集的测试结果,以及在Jetson Nano/TX2嵌入式平台的部署测试结果表明,该系统检测性能较原始YOLOv8n显著提升,在雨雾、遮挡、小尺寸等复杂场景下表现良好,可满足交通标志实时检测的需求。
摘 要:交警手势识别是智能驾驶系统实现车路协同的关键技术,其性能直接影响无人驾驶系统的安全性与可靠性。然而,复杂光照、多目标干扰及手势相似性等问题,使传统手势识别方法的准确性与鲁棒性受限。针对该问题,本文提出一种融合特征融合、注意力机制及时序优化的交警手势识别方法。通过多层感知机(MLP)构建特征提取网络,实现骨骼特征提取;随后设计并行双通路注意力机制,其中时空注意力模块建模关节点空间关系与时间依赖,通道注意力模块自适应强化关键特征;同时,在长短期记忆网络时序建模基础上,引入滑动窗口与最短持续时间约束的时序平滑处理,有效提升手势识别稳定性。实验结果表明,该方法在复杂环境下识别准确率达97.77%,较传统LSTM方法整体提升了18.93个百分点,可满足实时性要求。
摘 要:空气质量指数(AQI)是衡量城市环境宜居性的关键指标,准确把握空气质量的变化趋势,对治理空气污染、引导生产生活实践具有重要意义。本文利用运城市2023年1月1日至2025年12月31日的AQI逐日数据,通过时间序列分析方法分析得到运城地区空气质量现状,建立ARIMA模型对运城市未来空气质量指数的变化趋势进行短期预测,以实现对运城地区空气质量的有效监测,进而为相关部门制定和实施“十五五”时期大气污染防治政策提供科学依据。
摘 要:田间杂草的精准识别分类对农机除草及药剂选择至关重要。本文以蔬菜幼苗期9类常见田间杂草为研究对象,基于机器视觉技术,提出基于图像处理的杂草前景分割方法与局部稀疏表示分类模型(K_SRC)。先对杂草图像Lab颜色空间a分量进行K-means聚类、阈值分割及面积滤波,经掩膜运算提取纯净杂草图像,融合颜色与SLBP纹理特征构建训练样本集;再结合KNN算法构建局部字典,通过正交匹配算法计算稀疏系数,依据最小残差准则完成杂草分类。实验表明,该算法平均分类准确率达96.3%,优于四种对比算法。本研究可为田间杂草防治提供技术支撑,并拓展稀疏表示在农业领域的应用思路。
摘 要:针对智慧城市5G专网建设项目中,不同职能部门业务切片之间严格的安全隔离要求,本文提出一套完整的5G网络切片安全隔离与防护综合技术方案,该方案构建了基础设施层、网络层、应用层的三层递进式安全防护体系,结合硬件辅助虚拟化、Segment Routing等关键技术,实现各层资源与数据的逻辑隔离,还引入了基于区块链的切片管理记录机制和基于图神经网络的威胁检测模型,形成覆盖全生命周期的主动安全防御能力。方案在Open5GS开源平台上构建了原型系统进行验证,结果表明:方案隔离度高达99.99%,资源开销控制在8%以内,切片创建时间缩短至30 s以内,可以有效解决多租户切片资源共享环境下的安全挑战,为智慧城市关键业务在5G专网中的安全部署提供技术支撑与工程参考。
摘 要:随着高校信息化建设的不断深入,各业务系统数据规模迅速增长。然而,传统数据库查询模式依赖预定义功能接口,存在使用门槛高、响应效率低等问题,难以满足高校部分实际需求。针对上述问题,本文提出一种基于Text-to-SQL的高校业务数据智能检索方案。该方案基于LangChain构建自然语言交互框架,采用微调后的Qwen2.5-7B-Instruct大语言模型,并结合提示工程技术实现自然语言到结构化查询语句(SQL)的自动转换,从而完成该检索系统的私有化部署。实验结果表明,该方案在自建的高校业务数据库环境下,SQL执行准确率达62%,平均响应时间在10秒以内,能够显著提升业务人员数据获取效率。该方案为高校业务数据智能检索提供一种具有较高可行性的技术路径。
摘 要:面向听障群体对智能家居系统的实际需求,本文以传统语音交互智能家居系统为基础,引入手势识别与人脸识别,并结合物联网与数字孪生技术,构建了一套听障友好型智能家居系统。该系统通过摄像头捕获手势视频流,通过MediaPipe框架识别手势,并赋予不同手势具体执行功能,用于控制照明与新风设备的开关;采用face-api.js框架实时检测入室人脸并区分家庭成员和陌生人,实现安防预警;通过Three.js框架构建了室内三维场景的数字孪生体,可实现室内状态虚实同步和远程控制。本文开展软硬件联合模拟实验,结果表明,系统可准确通过手势控制硬件开关,通过人脸识别进行安防预警,数字孪生显示和远程控制功能均切实可行。该系统可为听障群体提供便捷的家居交互体验。
摘 要:针对传统单模态系统存在的语义孤立、方言传承力度薄弱、大模型方言应用缺失等问题,本研究提出一种基于多模态大模型与YOLOv11的方言处理系统。该系统采用Vue+Python架构,整合文本、语音、视觉多模态信息并嵌入大模型进行处理:文本层采用LLM增强语义复原和推理;语音层集成API实现多方言识别与合成;视觉层运用YOLOv11进行手语到方言转译。系统集成AI语料库索引、发音评估、文化普及模块,实现了方言发音评测、多模态识别、方言语音识别与合成等功能。本研究构建的多模态方言处理系统,将方言保护从“静态存档”推进至“动态参与”,为濒危方言提供可复用、可扩展的技术范式。
摘 要:动车组车下设备舱火情往往不易被直接察觉,蔓延速度快且现场处置受限,单纯依靠传统感温电缆或火焰探测手段难以实现提前预警。本文基于实验平台开展研究,在线获取VOC、温度、CO及烟雾浓度等多源传感数据,建立面向不同报警等级的火灾分级预测框架;在模型方面分别构建XGBoost、LightGBM与CatBoost预测器,并通过Bagging与Stacking两类集成策略提升整体性能。实验结果表明,融合模型在独立测试集上的准确率达98.5%,整体优于各单模型及基于注意力机制的CNN-LSTM对比方法。后续研究可在设备舱关键位置布设多点探测器,并对多点输出进行融合,以增强在风速扰动等复杂条件下的火灾风险稳定识别能力。
摘 要:针对“信息网络布线技术”课程传统教学方法的不足,本文构建了基于工程实境的课程改革总体实施路径。本文通过分析岗位核心技能,融入四新,以岗课赛证融通的教学理念重构教学内容;基于真实项目,将实训任务链与工程项目链双链耦合,以学生为中心,按照5E教学模式进行教学策略创新设计,形成基于“四个转变”的行动导向课程教学模式;深化校企协同,构建仿真工地+移动课堂的校企工程化实境平台,构建数智化工程实境式教学资源;设计“网E指数”作为综合表征量,优化SGP模型,形成增值评价,通过有效教学评估反馈教师教学效果。结果表明,基于工程实境的课堂教学三维指标平均提高了36%以上,提升了学生对专业的认可度,具有较好的实施成效。
摘 要:针对航空类应用型本科高校的专业课程思政与航空特色人才培养融合不足的问题,本文以操作系统课程为例,提出了OBE理念下融合航空精神的课程思政混合式教学方案,并从课程目标构建、思政元素挖掘、混合式教学设计和评价方法设计等方面开展教学改革探索。最后,通过教学数据分析,对该方案的课程实施效果与育人成效予以验证。
摘 要:针对高职计算机类课程传统PBL教学存在的知识碎片化、学生主动性差、个性化指导缺失等问题,结合智能技术发展趋势,本文提出引入AI智能体构建智能技术赋能下的项目式学习模式,突破现有的知识割裂与碎片化困境;基于建构主义和支架式教学理论,将AI智能体融入项目式学习全流程,搭建“问题驱动—智能支持—能力进阶”的教学链路;以“Vue应用开发”课程为载体,以任务为导向设计五个循序渐进的教学环节,将AI智能体深度融入教学全过程;实践验证表明,AI智能体有助于解决传统PBL教学中存在的问题,助力实现高职编程类课程教学改革目标,对高职编程类课程教学改革具有重要实践价值。
摘 要: 文章以学生成绩为研究对象, 开展分类预测研究, 首先采用轻量级梯度提升机(LGBM)算法筛选特征, 明确学习态度与基础、学习行为与策略是影响成绩的核心因素; 针对数据存在的不平衡性与边界模糊性, 利用混合采样(SMOTE-Tomek)技术优化样本分布, 提升数据质量; 随后构建随机森林、决策树、K-近邻等6个单一分类模型和软投票法融合模型进行分类预测。实验结果表明: 软投票法融合模型的综合性能最优。基于研究结论, 文章建议教学中聚焦学习态度与行为的培养, 借助最优模型实现成绩风险的精准预测与干预, 为提升教学质量提供数据支持。
摘 要:在数字技术深度融合体育赛事的背景下,传统分散式服务模式已难以满足大型赛事综合性、即时性与个性化的数字化观赛需求。杭州亚运会首创的“智能亚运一站通”平台,突破单一功能集成的局限,构建了“赛事—城市—生态”三位一体的服务架构,打造了一站式数字服务体系,实现从技术服务向生态赋能的范式转型。本文通过案例研究,系统解析平台在跨场景服务融合、高并发微服务治理、多模态交互及国际化适配等方面的创新实践,并从技术实现、商业模式与治理协同三个维度评估应用成效。本文提出模块化、可插拔的系统推广路径,为不同规模体育赛事的数字化转型与智慧城市建设提供可复制、可运营的参考框架。
摘 要:财政电子票据改革涉及的领域越来越广泛,电子票据数据安全保障问题日趋重要。针对电子票据敏感数据安全问题,本文给出了基于全同态加密实现的医疗收费电子票据全生命周期数据安全解决方案。本文部署分布式电子票据全生命周期密态安全流转控制平台,通过数据加密、密态计算、密态流转等技术设计,实现电子票据中的个人敏感信息在存储、传输、应用、管理等各个环节密态流转和安全访问控制。最后,通过对全流程密态动态流转控制体系的分析,给出了方案在处理个人敏感信息泄露和篡改等问题上的独特优势,为财政电子票据数据安全保护及跨区域共享提供技术支撑和实践参考。