begin process at 2012 02 08 22:42:47
  Trouver un code source :
 
dans
 
Accueil > Forum > 

Archive SQL

 > 

Archives

 > 

Besoin d'aide pour ma base de données

 > 

Suppression de doublon....


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Suppression de doublon....

jeudi 6 avril 2006 à 14:09:08 | Suppression de doublon....

Ry_Yo

Bonjour à tous,

Je travail sous sqlserver et après recherche sur votre site, je n'ai pas trouvé de méthode pour supprimer des doublon ou triplon, quadruplon...d'une base...
prenons par exemple ma table "toto" qui possède un champ unique...

champ
-------
1
1
1
1
2
2
3
4
4
4
5
Donc la seule façon que j'ai trouvé c'est de faire un distinct dans une table temporaire, dropper la table principale et la recréer avec les enregistrements de la table temporaire...
Bon cette solution est pas trop viable quand c'est une table en production....

Merci de votre aide....
jeudi 6 avril 2006 à 14:32:46 | Re : Suppression de doublon....

Mindiell

As-tu un champ permettant de différencier les lignes entre elles ? par exemple : 1 prenom1 1 prenom2 1 prenom3 Sinon, si deux lignes sont exactement egales, alors désolé, mais c'est impossible de le faire directement. Il faut inserer une nouvelle colonne unique... Tiens nous au courant :o)
jeudi 6 avril 2006 à 14:50:07 | Re : Suppression de doublon....

Ry_Yo

Hélas si j'avais un identifiant unique ça serait plus simple....

Mais ceux sont vraiment des lignes identiques.... En fait la table a été crée sans id.... ce qui fait que certain user sont des frénésiques du clic et intègre en plusieurs exemplaires les données...

Voilà donc mon problème..... Depuis j'ai mis en place un contrôle avant insertion dans la table par programmation... mais pour les enregistrements déjà passé.... il faudrait que je delete les lignes en x exemplaires......
jeudi 6 avril 2006 à 15:04:04 | Re : Suppression de doublon....

Mindiell

Comme expliqué ci-dessus : insère une nouvelle colonne strictement unique afin de nettoyer ta table, puis tu pourras la supprimer...
jeudi 6 avril 2006 à 17:41:35 | Re : Suppression de doublon....

Ry_Yo

Pour rajouter une colonne ok
Mais pour créer un numéro unique ça je ne sais pas faire.....(dsl)
ma table comporte 7 millions de lignes... je me vois mal le faire manuellement...
Je suppose qu'en faisant une procedure stockée ou autre on peut ajouter un numéro unique en automatique ?
jeudi 6 avril 2006 à 19:07:00 | Re : Suppression de doublon....

Mindiell

Réponse acceptée !
Sur SQLServer, EntrepriseManager : - Modifier Table - Ajoute un champ nommé "idid" ou autre :o) - Mets le en entier (int) - Mets le en compteur (la fenetre du dessous) - Appuye sur "Sauver" - Va boire 12 cafés et dormir... 13 millions de ligne sont en cours de modifs ;o)
jeudi 6 avril 2006 à 19:13:13 | Re : Suppression de doublon....

rvblog

Membre Club
Salut Ry_Yo, salut à tous les autres,

Solution hypothétique (plus propre que le DROP), fais un script :

Sauvegardes ta table avant (garantie AS IS), lis le script, et fais-toi ton avis avant de l'exécuter (je ne voudrais pas être responsable de la fin de ton CPE :) )

1./ un SELECT PseudoPK, Count(*)
         INTO TempTablePK 
         FROM TableMoche
         GROUP BY PseudoPK
         HAVING count(*) > 1

remplirait une table temporaire avec les clés correpondant aux doublons, triplons...

2./ un SELECT DISTINCT TableMoche.*
         INTO TempTablePKDoublons
         FROM TableMoche, TempTablePK
         WHERE TableMoche.PseudoPK = TempTablePK.PseudoPK

remplirait une table temporaire avec les lignes uniques liées à des doublons,...

3./ un SELECT PseudoPK, count(*)
          FROM TempTablePKDoublons
          GROUP BY PseudoPK

vérifierait que chaque ligne est bien unique, en retournant 1 comme compte pour chaque ligne (j'espère pour toi qu'il n'y a pas 3,5 millions de lignes uniques)

4./ un DELETE TableMoche
            FROM TableMoche, TempTablePK
            WHERE TableMoche.PseudoPK = TempTablePK.PseudoPK

effacerait de la table moche juste les lignes possédant les PseudoPK incriminés.

5./ un INSERT TableMoche
         SELECT * FROM TempTablePKDoublons

ré-insèrerait les lignes uniques dont le PseudoPK était incriminé.

à+

rvblogn
Je veux ton bien... et je l'aurais

jeudi 6 avril 2006 à 19:54:28 | Re : Suppression de doublon....

Mindiell

Un truc important : SELECT PseudoPK, count(*) FROM TempTablePKDoublons GROUP BY PseudoPK HAVING count(*)>1 Ca permet de sortir les doublons, et uniquement eux ! ;o) Deuxièmement, ma solution permet de supprimer les doublons sans jamais en effacer trop dans la table... A toi de voir !
jeudi 6 avril 2006 à 22:24:19 | Re : Suppression de doublon....

rvblog

Membre Club
Salut Mindiell,

tu as déjà bien raison de relire, c'est important.
En effet, pour le point 3, la vérification est plus courte ainsi!

Ta solution est celle que j'aurais choisie d'instinct si j'avais le problème, mais ni je n'ai le problème, ni le pouvoir de faire le choix de la solution :)

Ceci dit, pour quand même essayer de vendre ma solution :) je n'aurais jamais, même dans le pire des cas (par ex: 1 seul doublon = 6 999 999 modifs), à modifier 7 millions d'enregistrements, parmi 7 millions d'enregistrements dans une table!

du coup, Ry_Yo aura moins de caféïne dans le sang avant d'aller se coucher !)

PS : quoi qu'il en soit, on est tous d'accord, une table sans PK, c'est pas une table, c'est une feuille de calcul, et une feuille de calcul avec une seule colonne, c'est pas une feuille de calcul, c'est une punition, et une punition de 7 000 000 de lignes, t'as du faire une sacrée bêtise :)
à+

rvblogn
Je veux ton bien... et je l'aurais

jeudi 6 avril 2006 à 22:40:07 | Re : Suppression de doublon....

Ry_Yo

Merci de votre aide je vais mettre ça en place dès demain.... Ni vu ni connu j'atoute la colonne, je delete les doublons, triplons et autres et j'alter de nouveau ma table en virant l'id... comme ça on m'accusera pas d'avoir touché la structure d'une table en cas de soucis (hypothétique) par la suite.....

1 2

Cette discussion est classée dans : table, champ, suppression, trouvé, doublon


Répondre à ce message

Sujets en rapport avec ce message

probleme de comparaison de table [ par ehmarc ] SalutJe suis sous MySQL voici ma requetejai deux table t1 et t2 qui ont en gros une soixantaine d'entrer chacunneje veut faire ressortir les champ qui somme terme a terme éléments d'un champ [ par negstar971 ] Comment je dois faire si avec un table comme la suivante | relevé ||    2     ||    3     ||    4     ||&nb COMMENT FAIRE UN CHAMP like UN AUTRE CHAMP [ par Delph83 ] Bonjour tout le monde Voilà j'ai un problème avec une requête sql et la clause LIKE : <P class=MsoNormal style="MARGIN: 0cm 0 Suppression de caracteres dans un champ TEXT [ par Sbt ] Bonjour à tous, Dans une de mes tables, il y a un champ TEXT, nommé RES_TXT. Dans ce champ, on y insert tout un fichier texte, sur lequel on n'a pas Insertion d'un résultat d'une requete [ par nounours21_6 ] Bonjour a tousvoila, j'ai deux tables quasiment identiquela différence se porte sur un champdonc j'ai fais une procédure stockée sous SQL Server 2005 Requête avec champ Null [ par Blaster13 ] Bonjour à tous,J'ai un petit souci et n'étant pas un champion du SQL ni du VBA je voulais savoir s'il existait une solution:Petit résumé:Pour faire si Probleme de Requete [ par ehmarc ] Salut à tous,Voila j'ai un soucis je possede une table X dans laquelle je fait une requete genre : select * from X where Champ = 'toto' ma requete mar choix champs Texte ou Memo / optimisation [ par yan35 ] Bonsoir,Je voudrais optimiser 1 base Access qui commence à ramer avec 40000 enregistrements d'une longueur de plus de 400 octets, dans 1 table.J'ai un Insertion [ par le_totophe ] Bonjour à tous, je voudrais gérer des contacts au sein d'une base de données qui comporte (schématiquement) une table avec un champ contact_id auto-in aide [ par asmaa17 ] salut,j'ai deux questions j'espere de vous m'aider pour les resoudre: 1-j'ai cree deja une table et j'ai oublié  de mettre un champ en mode numero aut


Nos sponsors


Sondage...

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 2,527 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales