Méthodes

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Résultats de l'analyse factorielle
Sources de données
Géocodage
Techniques de cartographie
Unités spatiales d'analyse
Analyse multidimensionnelle
Autocorrélation spatiale

Résultats de l'analyse factorielle

L'analyse factorielle a été produite à l'aide du logiciel SPSS . Elle a été préférée à l'analyse en composantes principales dans le but de révéler les facteurs latents (Costello et Osborne, 2005). Comme certaines variables ne présentaient pas de distributions normales, la méthode d'extraction des principaux axes factoriels (principal axis factors) a été privilégiée. Enfin, une rotation oblique (direct oblimin) a été effectuée pour clarifier la structure factorielle tout en permettant aux facteurs de demeurer partiellement corrélés, ce qui correspond davantage aux phénomènes observés en sciences sociales (ibid.).

Dans le cadre de ce travail, 23 variables du recensement ont été choisies pour l'analyse factorielle. Cette sélection avait pour but d'éviter la redondance d'information entre les variables et de représenter les principales caractéristiques environnementales identifiées par des travaux antérieurs pour leur association à la criminalité (Fitzgerald et autres, 2004; Savoie et autres, 2006; Wallace et autres, 2006; Kitchen, 2006; Andresen et Brantingham, 2007; Savoie, 2008).

Six facteurs ont été identifiés soit, selon l'ordre d'extraction, la mobilité résidentielle, la population jeune, la diversité ethnoculturelle, le désavantage socioéconomique, les logements vieillissants et l'activité commerciale. Il est à noter que l'ordre d'extraction dépend de la variance de l'ensemble du jeu de données expliquée par le facteur, et non de l'importance de la différentiation des AD en fonction de ce facteur ou de l'association statistique entre le facteur et la criminalité.

Les résultats montrent que les inégalités de revenu (mesurées par des variables comme la valeur des propriétés, la proportion de familles à faible revenu ou le revenu individuel médian) ne constituent pas une dimension spécifique de l'espace résidentiel de Saskatoon. En fait, ces inégalités présentent de multiples facettes qui sont représentées, dans cette étude, par trois facteurs distincts : la mobilité résidentielle, le désavantage socioéconomique et les logements vieillissants. À Saskatoon, la même remarque s'applique à la proportion d'Autochtones vivant dans une AD : elle est plus élevée dans les quartiers à faible statut socioéconomique, à forte mobilité résidentielle et dont les logements sont vieillissants.

Quoique les coefficients soient relativement faibles, les facteurs sont pour la plupart significativement corrélés entre eux (tableau 7). Ces corrélations témoignent à la fois de la spécificité de chacun des facteurs et de leur interdépendance.

Tableau 7 Coefficients de corrélation Pearson des facteurs, ville de Saskatoon, 2001. Une nouvelle fenêtre s'ouvrira.

Tableau 7
Coefficients de corrélation Pearson des facteurs, ville de Saskatoon, 2001

La contribution relative des variables aux facteurs est affichée au tableau 8. Il est à noter que plus la valeur absolue est élevée, plus la contribution est forte. Ainsi, une forte valeur négative signifie une contribution élevée, tout comme une forte valeur positive. De plus, les fortes valeurs opposées témoignent des contrastes à l'intérieur d'un facteur. Par exemple, les AD de forte mobilité résidentielle montrent des proportions élevées de locataires mais des proportions faibles de personnes n'ayant pas changé d'adresse depuis cinq ans, et vice versa. Enfin, le sens (+/-) de la contribution n'a qu'une signification relative, c'est-à-dire qu'une valeur négative s'oppose à une valeur positive.

Tableau 8 Matrice des contributions aux facteurs, ville de Saskatoon, 2001. Une nouvelle fenêtre s'ouvrira.

Tableau 8
Matrice des contributions aux facteurs, ville de Saskatoon, 2001

Sources de données

Programme de déclaration uniforme de la criminalité fondé sur l'affaire

Le Programme de déclaration uniforme de la criminalité fondé sur l'affaire (DUC 2) sert à recueillir des données détaillées sur les diverses affaires criminelles signalées à la police, y compris les caractéristiques des affaires, des auteurs présumés et des victimes.

Dans ce programme, un maximum de quatre infractions peut être consigné dans la base de données pour une même affaire criminelle. Les infractions choisies sont classées selon leur degré de gravité, aspect lié à la peine maximale que prévoit le Code criminel.

Les analyses des grandes catégories d'infractions (affaires avec violence, affaires contre les biens, autres affaires) figurant dans ce document portent sur l'infraction la plus grave dans chaque affaire. Il en est de même pour les taux de criminalité diffusés chaque année par le Centre canadien de la statistique juridique (CCSJ). Dans un tel classement des infractions, une plus grande priorité est accordée aux crimes violents qu'aux crimes contre les biens. Par conséquent, les infractions moins graves peuvent être sous-représentées lorsque seule l'infraction la plus grave est considérée.

Lorsqu'un seul type d'infraction est considéré, toutes les affaires dans lesquelles ce type d'infraction est déclarée sont incluses, quel que soit la gravité ou le classement de l'infraction dans l'affaire. Dans le présent document, c'est le cas des affaires de voies de fait, de vol de véhicules à moteur, d'introduction par effraction, de méfait, d'autres vols et de vol à l'étalage. Grâce à cette méthode, on obtient une représentation plus complète de la répartition spatiale des différents types d'infractions individuelles.

Ce document porte sur la plupart des infractions au Code criminel et sur l'ensemble des infractions à la Loi réglementant certaines drogues et autres substances , mais il exclut les infractions à d'autres lois fédérales et provinciales ainsi que les infractions aux règlements municipaux. Sont également exclues les infractions au Code criminel pour lesquelles il n'y a pas de modèle prévu de répartition spatiale ou de données permettant de les situer. Par exemple, le tribunal est normalement considéré comme le lieu des infractions contre l'administration de la justice, telles que la violation des conditions de la liberté sous caution ou de la probation et le défaut de comparaître. Pour ce qui est des appels téléphoniques harcelants ou menaçants, le lieu de l'affaire consigné est souvent le point de réception de l'appel, et pour la conduite avec facultés affaiblies, c'est le lieu de l'arrestation qui est probablement plus susceptible d'être consigné (p.ex. les arrestations pendant un barrage routier).

Les affaires avec violence comprennent l'homicide, la tentative de meurtre, l'agression sexuelle, les voies de fait, les infractions entraînant une perte de liberté, le vol qualifié, l'extorsion, le harcèlement criminel, les menaces, les explosifs causant la mort ou des lésions corporelles, et d'autres infractions avec violence.

Les affaires contre les biens comprennent le crime d'incendie, l'introduction par effraction, le vol de moins de 5 000 $, le vol de 5 000 $ et plus, le vol de véhicules à moteur, la possession de biens volés, la fraude et le méfait.

Recensement de la population

Le recensement contient des informations sur la population, les logements et les emplois non seulement à l'échelle du Canada, mais à celles des provinces et territoires, et des régions plus petites, comme les villes ou leurs quartiers. Le recensement fournit également des données sur les caractéristiques démographiques, sociales et économiques du pays.

Les données socioéconomiques détaillées utilisées dans le présent document proviennent du questionnaire complet du recensement destiné à un échantillon de 20 % des ménages.

Statistique Canada mène le recensement de la population tous les cinq ans, et la dernière reprise a eu lieu en 2006. Pour obtenir la plus grande compatibilité possible entre les données sur les caractéristiques des quartiers du recensement et celles sur la criminalité, on a eu recours, dans ce document, aux données policières et censitaires de l'année 2001. Au moment de la réalisation de cette étude, les données détaillées sur les caractéristiques de la population du Recensement de 2006 portant sur le revenu des personnes n'étaient pas encore disponibles.

Définition des variables

Logements construits avant 1961 :bPourcentage des logements construits avant 1961.

Logements construits après 1990 : Pourcentage des logements construits après 1990.

Logements nécessitant d'importantes réparations : Pourcentage des logements qui nécessitent des réparations majeures (plomberie ou installation électrique défectueuse, charpente des murs, des planchers ou des plafonds à réparer, etc.).

Pièces par logement : Nombre moyen de pièces par logement.

Valeur moyenne des propriétés : Montant moyen en dollars que s'attendraient à recevoir les résidents propriétaires s'ils vendaient leur logement.

Locataires : Pourcentage de résidents qui habitent dans un logement non occupé par le propriétaire.

Personnes de moins de 15 ans : Pourcentage des résidents de moins de 15 ans.

Personnes de 65 ans et plus : Pourcentage des résidents de 65 ans et plus.

Personnes vivant seules : Pourcentage des résidents qui habitent seuls.

Familles monoparentales : Pourcentage des résidents qui font partie d'une famille monoparentale.

Personnes ayant déménagé depuis un an : Pourcentage des résidents âgés d'un an et plus qui n'habitaient pas à la même adresse un an auparavant.

Personnes n'ayant pas déménagé depuis cinq ans : Pourcentage des résidents âgés de cinq ans et plus qui habitaient à la même adresse cinq ans auparavant.

Personnes utilisant l'automobile pour se rendre au travail : Pourcentage des résidents ayant travaillé l'année précédant la tenue du recensement, ayant indiqué avoir un lieu de travail fixe et ayant utilisé une automobile en tant que conducteur comme principal moyen pour se déplacer entre son domicile et son lieu de travail.

Personnes sans diplôme d'études secondaires : Pourcentage des résidents de 20 ans et plus sans diplôme d'études secondaires.

Personnes titulaires d'un diplôme universitaire : Pourcentage des résidents de 20 ans et plus titulaires d'un baccalauréat ou d'un diplôme d'études supérieures.

Nombre moyen d'années de scolarité : Somme des années terminées avec succès à l'école, aux niveaux primaire, secondaire, collégial et universitaire (moyenne pour les résidents de 15 ans et plus).

Taux de chômage : Pourcentage des résidents en chômage par rapport aux résidents faisant partie de la population active.

Revenu d'emploi moyen : Revenu de salaires et traitements moyen des résidents de 15 ans et plus, ayant déclaré un revenu et travaillant à temps plein.

Revenu d'emploi médian : Revenu de salaires et traitements médian des résidents de 15 ans et plus, ayant déclaré un revenu et travaillant à temps plein. Il correspond au 50e percentile, soit celui qui divise en deux moitiés le nombre de cas considérés.

Transferts gouvernementaux : Pourcentage du revenu total composé de transferts gouvernementaux (prestations d'assurance-emploi; prestations des régimes de pensions du Canada et de rentes du Québec; Prestation fiscale canadienne pour enfants; prestations d'aide sociale; etc.).

Faible revenu : Pourcentage des résidents faisant partie d'une famille économique qui consacrent 20 % de plus que la moyenne générale à la nourriture, au logement et à l'habillement.

Autochtones : Pourcentage des résidents déclarant appartenir à un groupe autochtone.

Nouveaux immigrants : Pourcentage des résidents ayant immigré au Canada de 1991 à 2001.

Membres de minorités visibles : Pourcentage des résidents non autochtones appartenant à une minorité visible.

Construction, fabrication, transport et entreposage : Nombre d'emplois des secteurs 23, 31-33 et 48-49 du Système de classification des industries de l'Amérique du Nord (SCIAN) dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Commerce de gros : Nombre d'emplois du secteur 41 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Commerce de détail : Nombre d'emplois du secteur 44-45 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Autres services : Nombre d'emplois des secteurs 51, 52, 53, 54, 55, 56, 71, 72 et 81 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Santé et assistance sociale, et services d'enseignement : Nombre d'emplois des secteurs 61 et 62 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Administration publique : Nombre d'emplois du secteur 91 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Densité des emplois dans le secteur du commerce de détail : Densité, en km²; des emplois du secteur 44-45 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Densité des emplois dans les secteurs de l'hébergement et de la restauration : Densité, en km², des emplois du secteur 72 du SCIAN dont les lieux de travail sont localisés à l'intérieur de l'unité spatiale.

Géocodage

Le géocodage est l'activité consistant à faire correspondre une adresse avec un point de la surface de la Terre. Dans le présent document, l'adresse est le lieu de perpétration d'une affaire criminelle signalée à la police après agrégation à l'échelon du côté d'îlot, c'est-à-dire d'un côté de l'îlot entre deux intersections successives. À cette fin, on apparie les enregistrements de deux bases de données, l'une contenant une liste d'adresses et l'autre, des renseignements sur le réseau routier et la tranche d'adresses d'un îlot donné. L'outil de géocodage précise pour chaque adresse sa position unique dans le quadrillage routier. Comme le réseau routier est en référence géographique, c'est-à-dire qu'il se situe dans un système de coordonnées géographiques, on peut établir les valeurs longitudinales et latitudinales — les valeurs X et Y — de chaque affaire criminelle. Dans les cas où le lieu de l'affaire ne correspond pas à une adresse, le géocodage est effectué en créant, par exemple, un point sur une intersection de deux rues ou au centre d'un parc public. Les valeurs X et Y de la base de données sur les affaires criminelles forment la grille spatiale permettant de situer les points par rapport aux rues ou aux quartiers où ces affaires ont lieu.

En 2001, le Programme de déclaration uniforme de la criminalité fondé sur l'affaire (DUC 2) ne permettait pas de recueillir de renseignements sur l'emplacement géographique des affaires criminelles. Aux fins du présent document, le service de police de Saskatoon a transmis au Centre canadien de la statistique juridique (CCSJ) les adresses des affaires sélectionnées, déclarées et inscrites dans la base de données du Programme DUC 2 en 2001. Le CCSJ a transformé l'ensemble des renseignements en un jeu de coordonnées géographiques (X et Y) pour chaque adresse. Ces coordonnées ont été rapportées au point central d'un côté d'îlot dans le cas des adresses précises, et à des points d'intersection dans le cas des rues et des parcs.

Le Service de police de Saskatoon a transmis 23 711 affaires sélectionnées pour l'année 2001. L'exercice de géocodage a réussi dans 92,5 % de ces cas. Le faible pourcentage d'affaires qui ont échoué au géocodage ne crée pas de biais dans la tendance en matière d'infractions. Les affaires qui ont échoué au géocodage comportaient de trop grandes imprécisions, par exemple un numéro d'autobus ou une rue sans numéro civique. En fait, les tendances comparées des infractions géocodées et des infractions initialement soumises au processus représentent une même proportion dans la composition de la criminalité globale.

Techniques de cartographie

L'analyse des noyaux est la méthode qui sert à interpréter la répartition spatiale des données sur la criminalité. Elle permet d'examiner les points de données sur les affaires criminelles sans égard aux limites des quartiers et de dégager les endroits où se concentrent des affaires. Ce type d'analyse vise à estimer, à partir d'une représentation en points, la façon dont la densité des affaires varie à l'intérieur du territoire étudié. Elle a été conçue au départ pour estimer la densité de probabilité à partir d'un échantillon d'observations (Bailey et Gatrell, 1995). Dans son application aux données spatiales, l'analyse des noyaux produit une carte lisse de valeurs de densité, où la densité à chaque endroit correspond à la concentration de points dans un secteur donné.

Dans l'estimation par la méthode des noyaux, on superpose une grille fine au territoire à l'étude. On mesure les distances entre le centre d'une cellule de la grille et chaque observation qui se situe dans une zone d'influence établie appelée « largeur de bande ». Chacune des observations contribue à la valeur de densité en fonction de son éloignement du centre de la cellule. Les observations près du centre ont plus de poids dans les calculs de densité que les observations plus éloignées. Dans la présente étude, la taille d'une cellule de la grille correspond à 50 mètres carrés. Le rayon de recherche utilisé est de 500 mètres.

Le produit de l'application de la méthode des noyaux est une simple matrice de points (image tramée) qui indique les diverses courbes de densité. Les boucles que forment les courbes délimitent les points chauds, qui peuvent prendre une forme irrégulière et ne sont pas dictés par le découpage des quartiers ni par d'autres limites. Cette méthode d'analyse a été appliquée à l'aide du logiciel Spatial Analyst de l'Environmental Systems Research Institute.

Unités spatiales d'analyse

Les études écologiques comme celles réalisées dans les projets de cartographie de la criminalité nécessitent un nombre suffisamment élevé d'unités géographiques ou de quartiers en vue d'une modélisation des données efficace et fiable. Dans les études précédentes, l'examen des unités géographiques portaient sur les quartiers naturels tels qu'ils sont définis par les intervenants locaux (études de Winnipeg et de Regina) ou les secteurs de recensement (études de Montréal, Edmonton et Halifax) ou les aires de diffusion (étude de Thunder Bay).

Pour les analyses multivariées de la section 3, les aires de diffusion (AD) du Recensement de 2001 ont donc été retenues. Il s'agit de la plus petite unité spatiale standardisée à laquelle les données de recensement sont diffusées.

Les AD sont de petites régions composées d'un ou de plusieurs pâtés de maisons dont les côtés sont délimités par des rues formant des intersections qui regroupent généralement de 400 à 700 habitants. Les AD doivent satisfaire à plusieurs critères de délimitation conçus afin de maximiser leur utilité, par exemple : les limites des AD doivent respecter les limites des subdivisions de recensement et des secteurs de recensement (SR); les limites des AD suivent les routes, les voies ferrées, les plans d'eau, les lignes de transmission d'énergie, lorsque ces traits font partie des limites des subdivisions de recensement ou des SR.

Seules 328 des 335 AD de Saskatoon sont incluses dans les analyses parce que la valeur moyenne des propriétés n'était pas disponible pour les sept autres, ce qui compromettait le calcul des scores factoriels. Ces sept AD se dispersent sur l'ensemble du territoire municipal ( carte 1 ). Elles rassemblent un total de 438 affaires (2 % du total) et affichent un taux de criminalité de 63 affaires par 1 000 résidents et travailleurs (ce qui est inférieur à la moyenne observée pour l'ensemble de Saskatoon, qui est de 72).

Carte 1 Contexte local et aires de diffusion (AD), ville de Saskatoon, 2001. Une nouvelle fenêtre s'ouvrira.

Carte 1
Contexte local et aires de diffusion (AD), ville de Saskatoon, 2001

Les quartiers officiels de la ville de Saskatoon ont été reproduits par l'agrégation des îlots de recensement. À quelques rares endroits, les limites des quartiers tels que définis par l'agrégation des îlots ne correspondent pas aux limites officielles. Ces unités spatiales ont été utilisées pour dresser les portraits des quartiers de la section 2.

Analyse multidimensionnelle

La régression par les moindres carrés ordinaires (MCO) est utilisée pour examiner la répartition des taux de certains types d'affaires en fonction des caractéristiques des quartiers. L'application de cette méthode exige des variables continues ou quantitatives réparties normalement. Comme plusieurs des variables étudiées dans la présente analyse n'affichent pas de répartitions normales, il a fallu soumettre les variables de la criminalité à des transformations normalisatrices. Le choix de la transformation a reposé sur les résultats de test de Kolmogorov-Smirnov sur la normalité. La plupart des variables ou des caractéristiques des quartiers ont également été modifiées de manière à ce qu'elles présentent une répartition normale suivant cette classification :

Aucune transformation : Personnes de moins de 15 ans; Revenu individuel médian; Densité des emplois dans le secteur du commerce de détail; Densité des emplois dans les secteurs de l'hébergement et de la restauration; Personnes n'ayant pas déménagé depuis cinq ans; Pièces par logement.

Logarithme naturel : Transferts gouvernementaux ; Personnes vivant seules.

Racine carrée : Logements construits avant 1961; Logements construits après 1990; Logements nécessitant d'importantes réparations; Valeur moyenne des propriétés; Personnes de 65 ans et plus; Membres de minorités visibles; Familles monoparentales; Taux de chômage; Faible revenu; Locataires; Nouveaux immigrants; Personnes ayant déménagé depuis un an; Autochtones; Taux d'affaires avec violence; Taux d'affaires contre les biens; Taux d'affaires de voies de fait; Taux d'affaires de vol de véhicules à moteur; Taux d'affaires d'introduction par effraction; Taux d'affaires de méfait; Taux d'affaires de vol à l'étalage; Taux d'affaires d'autres vols.

Les modèles régressifs ont été élaborés selon la régression multiple pas à pas (stepwise). Cette méthode est une suite de régressions multiples telle qu'à chaque étape, on ajoute la variable qui prend en compte le maximum de variance restante. On élimine, à chacune des étapes, la ou les variables superflues.

Les coefficients de régression normalisés offrent un moyen de juger de l'importance relative des différentes variables explicatives dans les modèles de régression multiple. Ils indiquent la variation à prévoir, en unités d'écart type, de la variable dépendante pour un accroissement d'une unité d'écart type de la variable indépendante après avoir maintenu constantes les autres variables. Les valeurs maximales possibles sont 1 et –1, les valeurs de coefficient les plus proches de 0 montrant une moins grande contribution à l'explication de la variable dépendante.

L'autocorrélation spatiale constitue un autre aspect dont il faut tenir compte dans l'analyse spatiale de données, comme celles de la criminalité (voir « Autocorrélation spatiale » ci-dessous). La présence d'autocorrélation spatiale est détectée dans les résidus des modèles de régression des MCO pour les taux d'affaires de voies de fait (I de Moran de 0,11; p < 0,01), de vol de véhicules à moteur (I de Moran de 0,09; p < 0,01), d'introduction par effraction (I de Moran de 0,17; p < 0,001), de méfait (I de Moran de 0,07; p < 0,05) et d'autres vols (I de Moran de 0,09; p < 0,01).

Autocorrélation spatiale (par Krista Collins)

Les données qui sont mesurées sur une zone d'étude à deux dimensions, comme les affaires criminelles géocodées, subissent souvent l'effet des propriétés de leur emplacement. Si des observations voisines sont assujetties aux mêmes propriétés d'emplacement, elles ne seront pas indépendantes les unes des autres. Dans l'analyse des données, il faut tenir compte de ce manque d'indépendance pour produire des résultats exacts et non biaisés. On accomplit cette tâche au moyen de la modélisation spatiale des données, qui est importante pour tous les ensembles de données pouvant subir l'effet de la localisation.

On sait que la criminalité n'est pas répartie également dans les villes et qu'elle est concentrée dans certains secteurs appelés « points chauds ». Cela constitue une première indication que les données de la criminalité pourraient subir l'effet de l'emplacement, ce qu'on peut voir en examinant une carte de la densité de la criminalité dans les quartiers d'une ville. Il pourrait y avoir un effet positif dans les cas où les secteurs à forte criminalité sont entourés d'autres secteurs à forte criminalité et dans les cas où les secteurs à plus faible criminalité sont adjacents à d'autres secteurs à plus faible criminalité. On observe un effet négatif de l'emplacement dans le cas où un secteur à plus faible criminalité est entouré de secteurs à forte criminalité, et vice versa. Dans chacun de ces scénarios, il y a une structure spatiale ou une dépendance spatiale quelconque dans les données, ce qui signifie que les quartiers exercent une influence les uns sur les autres. Si la structure spatiale des données ne peut s'expliquer par les variables du modèle de régression, alors il y aura des effets spatiaux dans les valeurs résiduelles du modèle. Ce phénomène, qui est connu sous le nom d'« autocorrélation spatiale », contredit les suppositions avancées dans une analyse de régression ordinaire. Les effets de l'emplacement doivent plutôt être pris en compte dans un modèle à plusieurs variables, afin d'assurer une estimation fidèle des coefficients de régression et de leurs variances associées.

Aux fins de la modélisation spatiale, il faut définir ce que constitue un quartier avoisinant. Dans les présentes analyses, une structure de contiguïté qui comprend toutes les frontières communes et les sommets qui se touchent entre les frontières des régions sert à définir les quartiers qui sont voisins les uns des autres (premier niveau de contiguïté de type reine). La structure des quartiers définit les emplacements qui pourraient exercer une influence les uns sur les autres, les voisins, et elle exclut toute influence possible des quartiers qui ne sont pas considérés comme des voisins. La structure des quartiers sert à vérifier l'autocorrélation spatiale et à préciser la composante spatiale dans le modèle autorégressif spatial.

Le processus de base de modélisation des données spatiales consiste d'abord à adapter un modèle de régression par les moindres carrés ordinaires (MCO) aux données, puis à vérifier les valeurs résiduelles afin de déterminer s'il y a autocorrélation spatiale. On accomplit cela au moyen d'un test statistique appelé « test I de Moran », qui permet de déterminer si les valeurs résiduelles sont réparties de façon aléatoire sur le territoire étudié. Les valeurs de la statistique 1 de Moran varient entre 1 et - 1. Une valeur qui s'approche de 1 indique qu'il y a autocorrélation spatiale positive, c'est-à-dire que les quartiers affichant des valeurs résiduelles importantes sont adjacents à d'autres quartiers qui ont eux aussi des valeurs résiduelles élevées. Une valeur qui s'approche de - 1 révèle la présence d'une autocorrélation spatiale négative, dans laquelle les quartiers qui affichent des valeurs résiduelles élevées sont voisins de quartiers qui ont de faibles valeurs résiduelles. Une valeur près de zéro indique l'absence d'une autocorrélation spatiale. La signification de la statistique I de Moran est déterminée au moyen d'une approche de permutation aléatoire, où un résultat significatif indique qu'il y a présence d'une autocorrélation spatiale dans les valeurs résiduelles du modèle.

Lorsqu'il y a présence d'une autocorrélation dans les résidus d'un modèle de régression MCO , il faut adapter un modèle spatial aux données. Le modèle spatial propose la même analyse des caractéristiques des quartiers que le modèle MCO , mais il contrôle les effets de l'emplacement. Cela peut se faire de deux façons, soit en ajoutant une variable additionnelle pour représenter l'effet des quartiers avoisinants, soit en modélisant un processus spatial dans les valeurs résiduelles. Dans le premier modèle, qui est appelé « modèle à variable spatiale décalée », on suppose un effet direct du taux de criminalité sur les quartiers avoisinants. Dans ce cas, la valeur moyenne des taux de criminalité de tous les quartiers avoisinants, appelée « variable spatiale décalée », est ajoutée au modèle de régression pour représenter l'effet direct des quartiers avoisinants. Dans l'autre modèle, appelé « modèle de l'erreur spatiale », on suppose que le lien entre les taux de criminalité dans les quartiers avoisinants découle du même lien entre les variables explicatives dans les quartiers avoisinants. Ainsi, l'autocorrélation spatiale détectée dans le modèle de régression MCO tient à des variables autocorrélées sur le plan spatial qui ne figurent pas dans le modèle. Pour décider du type approprié de modèle spatial qu'il faut utiliser pour tout ensemble de données, les données sont vérifiées de façon empirique afin de déterminer la structure de la dépendance spatiale.

Les résultats de l'analyse de régression spatiale sont essentiellement les mêmes que ceux d'autres analyses de régression à plusieurs variables. Les coefficients de régression représentent la variation du taux de criminalité pour un changement unitaire de la variable, lorsque toutes les autres variables sont maintenues constantes. Étant donné que les variables qui représentent les caractéristiques des quartiers sont normalisées, l'importance de leur coefficient de régression indique leur contribution relative à la prédiction de la criminalité. Toutefois, les coefficients de régression des variables spatiales décalées et des variables d'erreur spatiale ne peuvent s'expliquer de la même façon. Le coefficient de la variable spatiale décalée représente en partie l'effet des quartiers avoisinants, mais il représente aussi une partie de l'erreur de mesure liée à l'utilisation d'unités administratives pour définir les quartiers. Ainsi, il n'y a aucune interprétation directe du coefficient de la variable spatiale décalée. De même, le coefficient de la variable d'erreur spatiale représente un paramètre nuisible dans le modèle, et ne peut être interprété directement. La variable d'erreur spatiale n'est retenue dans le modèle que pour assurer l'exactitude des autres résultats.

Le caractère approprié des modèles spatiaux est évalué au moyen de la corrélation carrée entre le taux de criminalité de chaque quartier et les valeurs prédites en utilisant le modèle spatial. Cette corrélation carrée est équivalente au coefficient de détermination (R2 ), qui est couramment utilisé dans les modèles de régression ordinaire, où il représente la proportion de la variation qui est expliquée par le modèle de régression. Toutefois, en présence d'une autocorrélation spatiale, la corrélation carrée entre les valeurs observées et les valeurs ajustées n'a pas la même interprétation. Elle indique plutôt le caractère approprié relatif du modèle. Une valeur de 1 signifie que le modèle est parfaitement adapté, alors qu'une valeur s'approchant de zéro indique que le modèle a un faible pouvoir de prédiction.

Pour s'assurer que l'autocorrélation spatiale a été suffisamment prise en compte dans le modèle, les résidus du modèle spatial sont vérifiés pour voir s'il y a présence d'autocorrélation spatiale. On accomplit cette tâche au moyen des tests du multiplicateur de Lagrange, qui servent à vérifier la présence d'une dépendance de la variable d'erreur spatiale dans le modèle à variable spatiale décalée et l'absence d'une variable spatiale décalée dans le modèle d'erreur spatiale. Si le test statistique n'est pas significatif, il indique que la dépendance spatiale dans les données a été prise en compte dans le modèle. Dans le cadre de ce travail, l'autocorrélation spatiale et les modèles spatiaux autorégressifs ont été estimés en utilisant un programme SAS créé à cette fin.