大数据分析开启了城市研究、规划和政策的新时代。高频数据中的实时数据挖掘和模式检测现在可以大规模进行。作为更循证的城市主义的一部分,新的分析实践可以帮助智慧城市更顺畅地做出决策。在本文中,我们讨论了大数据对长期城市政策和规划的价值和局限性。我们首先建立了一个关于城市分析的理论视角,将其作为一种实践,作为新智慧城市主义的一部分。我们确定了高频数据的暂时性和城市面临的长期结构性挑战的矛盾。利用使用大城市数据的实证研究,我们强调了基于战略目的的高频数据分析所带来的认识论和实践挑战,并就城市分析如何为长期城市政策提供信息提出了建议。
大数据和数字技术在智慧城市系统的应用中十分重要。数字技术和城市物理结构的结合,使大数据分析有望在实时预测、提升效率和居民行动便捷度等方面发挥显著作用。通过物联网连接到传感设备并组合处理不间断的数据流,城市系统有望实现新的决策方式:即在某些情况下,这些决策可以在很少人为干预的情况下实现自动化。
然而,大数据对城市智慧城市的战略价值的研究涉及到了时间跨度矛盾:即快速动态的高频数据处理与政策和城市结构的缓慢长期动态的矛盾。为了解决这一问题,我们需要对大数据的条件进行进一步的研究。一方面是高频数据和实时反馈的对比,一方面是长期结构性动态研究产生了的认识论上的挑战。以智能交通管理为例,分析驱动的智能交通管理可能会使日常出行更加顺畅,从而进一步鼓励居民出行——这种现象被称为交通规划中的“诱导需求(induce demand)”或流动性。更便捷的交通鼓励居民更改住房规划,从而影响城市的昼夜和住房情况。大数据针对特定目标输出的政策结果会影响居民的下一步行动,而这一行动是难以被预测的。这种认识论的问题需要学者对大数据的快速时间尺度和城市空间组织的缓慢动态之间的协调进行批判性讨论。因此,学者需要批判性地衡量大数据价值,特别是城市系统中的时间性和因果关系问题。
本文的研究目标是找到城市分析在哪些条件下可以为长期城市政策提供有效信息。我们总结了过去学者关于智慧城市的辩论,然后利用当代社会科学理论来绘制城市分析的起源,并将其时间概念化。随后,我们阐述了城市分析的特征并找到长期城市政策的动态分析中产生的实际的、认识论问题。最后,我们开发了6个命题,以确定城市分析可以有效地为战略、长期城市政策提供信息的条件,并对调查和扩展这些命题的研究提出了建议。
▍智慧城市和城市分析
智慧城市计划如今受到了广泛的学术辩论。在许多文献中,智慧城市被视为建立在城市活动和人类进步基础上的技术解决方案,体现了城市该如何组织、设计和管理的共识。另一种观点认为,智慧城市主要是公民对未来城市的想象推动了当代城市建设的方法。智慧城市概念由企业家、专家、智库和科学家组成的关系网络发起、调研并实践,使智慧城市概念作为一种规划和管理新方式逐渐成熟。
从以上角度看,有一些有影响力的团体推动了智能城市主义的形成,从分享思路、资源、主观倾向到越来越多的关注学术部分(如机器学习),学术的地位显著提高。我们可以说,城市分析并不是一套定义明确的技术方法,而是由一套在社会、政治和学术背景下进行的综合实践。在我们更为密切地研究城市分析在城市决策的作用前,我们首先阐述导致城市系统中广泛嵌入传感技术和处理技术这一社会趋势。
▍交通工具和城市大数据
在长期以来关于数字技术及其对城市的影响的争论中,交通工具提供了一个基于实践的视角,通过它可以将数字技术在城市的嵌入概念化——交通、信息和通讯技术与社会空间共同进化,导致社会互动愈加广泛。例如,由于交通和通讯技术的存在,人们得以在更大的距离下维持社会关系,进一步的社会功能性对更远距离的交通和数据通讯提出了要求,这依赖于捆绑在日益复杂的基础设施中的TICT。这种基础设施包括铁路网络、汽车、移动电话网络等。在这个共同进化的流动性的循环中,进一步扩大的时空距离为移动系统的数字化技术提了更高的要求,数字技术更广泛地嵌入到物理环境中,随后,由数字输入和控制的TICT又进一步推动了数字化和专家知识。在这一不可逆转的过程中,我们认为,在处理物理-数字移动系统产生的数据时,城市分析是一种实践。
交通的这一现象为智慧城市主义兴起过程提供了社会解释。同样,计算机社会科学的出现也可以被看作是这一流动性的结果。远程处理和云计算技术下的学界和商界的频繁合作,进一步推动了数字移动技术,从而反过来促进了二者的进一步的联合。
我们期待未来城市分析足以预测并处理这一流动性现象,尤其是技术参与后引发的连锁反应——虽然这超越了大数据分析过程中对某一特定需求的满足。当然,无论这一技术对社会目标的潜在贡献如何,城市分析都会受到一定利益联盟的积极推动,这些联盟在广泛意义上推动了智能城市主义。但是此外,学者们还发现了一个问题,智慧城市主义特征具有实时性:大数据在城市运营中会优先考虑实时性,而不是规划长期战略,且这一趋势可能会进一步扩大。
对城市分析和政策制定的关系,学者针对时间性问题提出了两个认识论问题。1. 快速动态的分析促进了对城市什么样的理解,并在多大程度上适用于城市政策通常关注的一般和深层次的因果动态?2. 城市分析通过算法改变、同步或规范城市行为体的实践来研究和理解城市,这影响了我们通过数据了解行为体进一步动作能力。因此,我们观察到的任何模式是人类和技术运行相互影响下的结果;在不断变化的人与制度的相互作用背景下,改变大数据的固有误差的本质是寻求城市系统中复杂的因果关系。我们将在下文探讨这两个问题。
▍城市分析的意义
为了确认城市分析的显著特征,我们以交通卡为例。交通卡自动在公共交通系统上收费,从而产生与绝大多数乘客有关的旅行记录。其优势在于覆盖面广、样本量大和准确性高。
4.1 刻画日常运动中的快速城市动态
智能卡记录的覆盖范围和准确性使记录出行特征,提取大量样本成为可能。为了研究这种高频数据集可以在多大程度上为政策提供信息,我们调用了伦敦交通卡信息。交通卡支付方式在涵盖了伦敦地铁85%的支付,包括乘客500万人次,11条地铁线和270个车站,乘客必须在旅程的始终点刷卡。这些数据除了出入时间和地点、支付状态,以及乘客身份外,没有其他属性。由此,我们得到关于起点(O)和目的地(D)的数据,并使用Dijkstra标准算法,通过确认最短路线来推断乘坐路线。这些数据有助于在分钟水平上捕捉和描述出行习惯,并从给定时间段的重复出行的时空特征中推断出人们的日常出行情况。
通过检查,我们发现,在分析角度所能接受的最短时间内(如1,2,5,10分钟),受试者在工作日的概况存在很大的异质性,这意味着超过一半的乘客没有固定的日常活动。这一特征在综合数据中难以发现,只能通过在个体样本上挖掘高频数据来识别。为了探索规律,我们进行跨站分析,并根据每对轨迹之间的相似性对它们进行分析。我们选择任意两个时间段,并计算每个站点的出行量之间的相似性。简而言之,这种比较是在任意两个时间点之间,以24小时内每20分钟为间隔,就所有270个车站在每个时间点的出行量进行比较。
图1显示了任何一对时间段的概况。图1(A)显示了任何一对时间段与所有站点的行程量之间的相关密度。在这里,我们根据交通量的等级重新排列了这些剖面,然后将其作为每个时间段车站的每对排序剖面之间的归一化差异进行比较,如图1(B)。在图1(C)中,我们计算了相似性的集。从图1(A)中看出,第一组(早高峰:7:00-9:00)存在高相关性,即所有站点的运量与每个站点的相关性都相当高。第二组(10:00-15:30) 存在类似时段,但总行程和总数量大幅度减少,矩阵仍然在时间模式上而不是在总体体量上显示出相似性。第三组(晚高峰: 16:00-19:00)也出现了相似但更清晰的模式。
为了提供旅行概况的详细解释,我们需要对出行的性质和地点及环境概况做出假设,包括城市在工作周的旅行分布结构、不同城市活动相关需求高峰。我们需要提取数据结构,然后进行可视化数据的方式处理。因此,可视化、识别和解释模式是一个循环的过程,它依赖于关于城市系统如何运行的外部数据、信息和理论,这种依赖随着高频数据分析技术进步将进一步增加。
本研究的研究核心是因果关系。过去,在超过几个月的时间框架内处理智能卡数据的研究很少见,许多开拓性研究的重点在于刻画不同层次的趋势,而不是系统性的解释。为了探究长期框架下的因果关系,Kandt和Leak(2019)研究了伯明翰地区2011-2016年66岁及以上乘客进行的3亿笔智能卡交易数据并发现, 六年以来乘客人数明显下降。为了从因果关系的角度解释该结果,我们利用低频背景数据、UK人口普查社区统计数据和年中人口估计数据发现,在对免费公交车依赖程度通常更高的较贫穷社区,乘车人数下降尤为明显。由此,我们能够得到与政策相关的因果假设(表1),最后通过三角互证衡量假设的合理性。
以上研究表明,从长期高频数据中推导因果结论需要许多要素: 基于理论的解释、情境化和三角互证检验等。这与短期传统计算方法形成了对比,后者的行为一般是检测并分析当前数据,设计模式使符合采样标准的乘客改变当前行为。这种自动化方法在实现短期目标方面可能是有效的,但在长期城市规划和政策背景下,由于未深究流动性的根本社会原因且未考虑主体和技术之间的相互作用,常常不能有效提供政策依据。
那么,我们如何在大数据中解释长期模型呢?社会实践理论及其支持证据表明,与传统数据不同,对大数据认知的解释会内在地受到解释者的主观因素影响。我们定义两个数据维度:技术(交通、基础设施)和主体(乘客、时间、路线)并研究数据捕获技术的实施方法、主体的行为影响以及二者在日常生活中的交互。从交通角度对智慧城市主义的推理中可以得出,交通和乘客互相作用的变化可能是由相同的技术原因驱动的,宏观的社会经济环境决定了他们连接关系。智慧城市主义承载了政府、社会机构等团体规范流动性、降本增效的愿望,以市场为导向的治理风格作为更广泛的经济意识形态的一部分,所有这些同时影响建筑环境、社会、地理和物质生活条件等社会中的各个方面。
总而言之,城市分析及其实践为智慧城市主义假设的提供短期、高频数据反馈,有助于对城市系统的理解,因为它支持快速生成新的假设,这些假设可以使用小的、低频的数据进行理论基础和情景化。但与此同时,大数据并不能有效解决因果问题。
▍讨论:城市分析和规划
城市分析和规划需要什么原则?本研究确认以下城市分析的定义和实用特征:
1.高频数据中快速动态与城市结构变化的缓慢动态形成对比;
2.在解释图案时,主观性程度高;
3.传感和计算技术在基础设施安装的政治特征;
4.捕获数据的复合特质。从某种意义上来说,大数据是传感技术工作、数据主体活动极其相互作用的符合信号;
考虑到以上特征,我们就城市分析对战略政策和规划的价值提出了以下主张:
(1)城市大数据系统提供了新的假设
城市分析很少为城市政策问题提供直接答案,但通过利用以地理时间为背景的城市分析的理论视角,大规模城市数据作为开发新假设的探索性材料可以间接为城市系统提供新的思路。这意味着,大数据给城市研究和政策带来的主要变化是更快的数据处理和分析速度和新的假设生成方式。
(2)理论更加重要
随着数据集和模式数量的增加,理论在解释模式方面变得更加重要。隐性的结果可以从现有的实证和实践经验中衍生出来。但为了透明地识别因果关系,也需要观测数据主体的综合社会环境和数据收集技术的结合。由于实践-理论视角将大城市数据识别为人类行为、日益感知的环境及其相互作用的复合信号,这一视角为根据全面的因果域构建解释提供了相关的框架。
(3)小数据集更加重要
小数据集不会被取代,反而需要被应用在建立模式的地理时间特征上以完善假设。大规模数据使传统数据源在长期研究、政策规划在战略上变得更加重要,因为受控的、科学的数据收集所产生的数据精准性在情景化和三角测量上都至关重要。虽然传统收集数据方法逐渐被淘汰,但在大数据分析中这类数据来源的使用频率仍在增加。
(4)战略洞察力依赖于长期证据
对于关注因果关系的城市政策,短期城市分析结果需要被长期情景所框定。从案例研究中发现,模式只能从长期活动数据中产生。迄今为止,由于数据传输和存储方面的实际限制以及数据共享限制、隐私问题和商业或政府敏感性等原因,智慧城市进展一直受到阻碍。虽然在城市分析中有大量的数据可视化工作,但在长期背景下,具体的挑战是决定在不断增长的数据量中,应该保留、提取或丢弃哪些数据,以便它们成为城市战略决策的资产。
(5)大数据洞察依赖于环境分析
城市感知技术的经验在环境分析上的应用在过去研究中较少。城市分析的环境理论视角可以帮助理解解释阶段,如定量计算需要考虑城市传感器的部署安排问题,从技术-主体的联系出发,解开两个维度的相互作用关系。更正式的方法中,我们可能会识别并囊括操作数据的元数据,例如公共交通网络变化的变量。更广泛的环境包括私营公司、学界、城市部门等行为者的决定,他们可能积极推动技术的部署以确保持续性回报。这些与城市机构如何运作、它们如何在基础设施中安装传感器和设备、如何投资和使用城市信息平台,以及这如何影响长期城市政策所需的因果推理有关。
▍结束语
综合来说,如果通过工具理性制定数据驱动的城市政策,自动化的软件分类将成为组织城市的有效基础。随着人们对日益复杂的物理-数字系统的依赖增加,城市机构可能会重现现有的权力关系,并扩大技术专家的影响力。
在这种社会背景下,我们确认了分析高频数据的认识论和实践挑战,并发现大数据和城市分析可能以比以前更快的速度产生新的假设。我们认为,在透明的理论基础和地理时间环境下,假设的合理性和战略价值都将得以实现。
很明显,在城市分析方面还需要进一步的概念和经验性工作,以解决在城市政策背景下出现的认识论和规范性挑战。在讨论我们有关城市分析的六个命题时,我们确定了一些研究需求,这些需求将有助于讨论。
1.更多关注在特定制度环境下解释大数据发现的模式所涉及的认知过程。在调查数据中,数据主体提供信息,但是理论推理和情景化步骤在大数据分析实践中有更大作用。
2.需要对城市分析相关技术在特定地理、社会和时间背景下的投资和安装方式进行研究。大数据的情景敏感性意味着,城市分析应该将重点从单一的“人类”作为数据主体,扩大到人和技术的交互,即技术和社会的相互作用。换句话说,城市分析应该放弃其行为主义取向,关注在城市系统作用下的人类行为和监管特征等符合信号,为应对城市面临的长期社会挑战和政策反馈提供信息。
3.研究应该推进对城市长期趋势的全面框架制定,以修正快速动态信息处理结果。大的城市数据需要消除时间规模的问题以适用长期社会模型。
该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们。