2024年6月14日下午15:00,数据大狮训练营系列沙龙《AI时代基于问卷调查和网络爬虫技术的智慧养老大数据收集、处理和分析》在华东师范大学理科大楼A1314会议室和腾讯会议299-602-681线上线下混合式顺利召开。南京审计大学统计与数据科学学院讲师齐学成博士、上海市城市设计与城市科学重点实验室研究员林肯、上海市城市设计与城市科学重点实验室博士后厉成伟、上海应用技术大学社会保障系主任戴建兵副教授、中国人民大学博士研究生叶怡君、上海交通大学博士研究生刘少维、华东师范大学公共管理学院博士研究生常继元、华东师范大学公共管理学院研究生师玉丽和牛鹏皓、华东师范大学其他学院和其他高校研究生等合计20多人参加沙龙。
本次沙龙由华东师范大学公共管理学院劳动和社会保障系系主任曹艳春教授主持。曹艳春教授是中国老龄学会老龄科研基地(华东师范大学)副主任,也是国家智能养老社会治理实验基地子课题负责人。本次沙龙是华东师范大学新文科创新平台第二轮专题数据库《智能养老社会治理专题数据库建设》(A类)建设项目的中期成果。
首先,曹艳春教授介绍了本次沙龙的议程、内容和参与嘉宾。本次沙龙的第一个数据分析任务,是基于社会调查老年人数字素养模型构建与数据分析,提出相关政策建议。
南京审计大学统计与数据科学学院讲师齐学成博士首先介绍了基于机器学习和网络爬虫技术的智慧养老数据收集和智慧养老模型构建。在数据采集层面,利用网络爬虫技术,基于关键词、热门词等规则对各省网址中养老政策、老年群体信息、老年人对养老服务和养老设备的意见等数据进行自动抓取,数据清洗后形成智慧养老数据库。在数据分析层面,利用机器学习技术,如决策树、随机森林、XGBoost、LightGBM等,基于智慧养老数据库采用数据预处理、多轮建模、交叉验证等方法,针对智慧养老服务建立鲁棒的泛化模型,来预测和分类不同类型的智慧养老服务,并提高预测的准确性和响应速度。
其次,齐学成博士介绍了基于自然语言处理的老年群体智慧养老情感数据收集和数据分析方法。分析老年人在使用智能养老设备时的语言表达和交流模式,采用马尔可夫模型、DNN神经网络模型、LSTM深度学习算法等自然语言处理技术,自动识别老年人使用养老设备后的情感倾向,判断是否具有积极、消极或中性情感,从而更好地理解和预防智慧养老服务中的人机交互风险。
上海市城市设计与城市科学重点实验室博士后厉成伟和林肯从城市数字养老的角度介绍了数据的收集和分析方法。
上海应用技术大学社会保障系主任戴建兵副教授介绍了智慧养老社会风险分类、数据收集和分析方法。
上海交通大学博士研究生刘少维参加了本次沙龙,并提出了一些模型构建的研究建议。中国人民大学博士研究生叶怡君、华东师范大学硕士研究生师玉丽和牛鹏皓也参加讨论并提出了一些模型构建建议。
本次沙龙在热烈的讨论中结束。