probleme mit awk

alana.the.witch · 16 Aug. 2008

Hallo zusammen

hoffe hier bin ich richtig und es kann mir wer helfen.

also ich habe eine Datei1.txt (wurde von einem Programm erzeugt) mit einer Spalte und ca 1 Millionen Zeilen.

123456789
225487963
587423589
523849523
usw.

dieser Datei möchte ich eine weitere Spalte mit awk hinzufügen:

awk '{print $1 " Datei1" }' Datei1.txt >> Datei2.txt

das erwartete Ergebnis sollte dann so aussehen:

123456789 Datei1
225487963 Datei1
587423589 Datei1
523849523 Datei1
usw.

leider sieht das Ergebnis so aus:

Datei16789
Datei17963
Datei13589
Datei19523

was mache ich falsch? oder gibts versteckte Zeichen? mit anderen Dateien funktioniert es auch.

vielen dank

PS: ich arbeite mit RedHat und bin neu in dem Bereich.

gruß
Alana

admine · 16 Aug. 2008

Hm ... also bei mir macht die Zeile genau das, was du willst :roll:
(openSUSE 11.0)

Code:

admine@reni3:/daten/tmp> awk '{print $1 " Datei1" }' Datei1.txt >> Datei2.txt
admine@reni3:/daten/tmp> cat Datei2.txt
123456789 Datei1
225487963 Datei1
587423589 Datei1
523849523 Datei1

framp · 16 Aug. 2008

admine schrieb:
Hm ... also bei mir macht die Zeile genau das, was du willst :roll:

Bei mir auch.
Wenn ich

Code:

$ awk '{print "Datei1 " $0}' t.txt

nehme dann bekomme ich Dein Ergebnis.

alana.the.witch · 16 Aug. 2008

Hallo

danke für eure Antworten, aber es ist hier wie verhext. wenn ich $1 "Datei" angebe gehts nicht und wenn ich "Datei" $1 angebe gehts. ich hab das thema öfters aber irgendwann funzt es dann schon, nur diesmal nicht.. und jetzt wärs echt wichtig....*grumml* und ich brauche die spalte mit den Zahlen vorne, damit ich zwei dateien vergleichen kann ( mach das mit join).

Gruß
Alana

framp · 16 Aug. 2008

Oder nimm perl:

Code:

perl -e 'while (<>) { chomp; print "$_ Datei1\n";}' datei.txt > result.txt

alana.the.witch · 17 Aug. 2008

hallo framp

danke für den tipp. hättest du noch einen für mich? ich wollte mit awk alle Zeilen zwischen einer Range raussuchen und diese in eine neue datei speichern. nur das blöde ist, wenn die start/stop nummer nicht existert erkennt awk den range nicht an.

beispiel: ich habe eine vorgegebene range 123456780 - 123457000 gehört zu bereich A die Datei ist unique und sortiert. Start und stop bereich können existieren müssen aber nicht. (auch zwischendrinnen können Zahlen fehlen)

passt in den range
123456785 Datei1
123456786 Datei1
123456787 Datei1
123456788 Datei1
123456789 Datei1

passt nicht in den range
225487963 Datei1
587423589 Datei1
523849523 Datei1

Vielen dank

gruß
Alana

abgdf · 17 Aug. 2008

Code:

perl -e 'while (<>) {$begin = 123456780; $end = 123457000; @a = split(" ", $_); $b = $a[0]; if($b >= $begin && $b <= $end) { print $_; } }' datei.txt > result.txt

framp · 17 Aug. 2008

Oder mit start und end als Aufrufparameter:

Code:

perl -e 'my $start = shift; my $end = shift; 
while (<>) {
   /(\w+)/;
   if ($1 >= $start && $1 <= $end ) {
      print;
   }
}' 10000 20000 datei.txt > result.txt

abgdf · 17 Aug. 2008

TMTOWTDI

framp · 17 Aug. 2008

abgdf schrieb:
TMTOWTDI

Jupp. Besonders in Perl

. Ich wollte einfach wissen wie man die Pipe Funktion und Parameter kombinieren kann

Und am besten lernt man anhand eines praktischen Beispiels

regexer · 18 Aug. 2008

alana.the.witch schrieb:
awk '{print $1 " Datei1" }' Datei1.txt >> Datei2.txt

Perl ist natürlich schöner

aber das müsste doch auch mit awk gehen ...

Meine Versuche:

Code:

prompt> echo 123456789 | awk '{print $1 " Datei1" }'
123456789 Datei1
prompt> echo 123456789 | awk '{printf "%s Datei1\n", $1}'
123456789 Datei1

... funktionieren beide bei mir. Versuch doch bitte auch mal die Variante mit printf

jengelh · 19 Aug. 2008

framp schrieb:
Oder nimm perl:

Code:

perl -e 'while (<>) { chomp; print "$_ Datei1\n";}' datei.txt > result.txt

Kürzer is das!

Code:

perl -lpe '$_.=" Datei1"'

framp schrieb:
perl -e 'my $start = shift; my $end = shift;
while (<>) {
/(\w+)/;
if ($1 >= $start && $1 <= $end ) {
print;
}
}' 10000 20000 datei.txt > result.txt[/code]

Code:

perl -lne 'INIT{($s,$e)=@ARGV}/(\w+)/;print if$1>=$s&&$1<=$e'

:-D BTW, war vielleicht /^(\d+)/ gewollt?

regexer · 19 Aug. 2008

jengelh schrieb:
Kürzer is das!

Code:

perl -lpe '$_.=" Datei1"'

Golf? Noch kürzer ist das:

Code:

perl -pe's/$/ Datei1/'

framp · 19 Aug. 2008

Interessante und lehrreiche Vorschläge. :up:

alana.the.witch · 20 Aug. 2008

mahlzeit

vielen lieben dank für eure hilfe, hab zwar nix verstanden aber es funzt *g*

gruß
Alana

framp · 20 Aug. 2008

alana.the.witch schrieb:
mahlzeit

vielen lieben dank für eure hilfe, hab zwar nix verstanden aber es funzt *g*

gruß
Alana

Ist ein beliebtes Spiel bei Perlianern: Wer schreibt das kürzeste Perl Script um eine bestimmte Aufgabe zu lösen. Aber die Hauptsache ist, es funzt bei Dir jetzt.

Hast Du schon den Thread Bitte gelöste Threads auf [gelöst] setzen gelesen :wink:

?

probleme mit awk

alana.the.witch

admine

framp

Moderator

alana.the.witch

framp

Moderator

alana.the.witch

abgdf

framp

Moderator

abgdf

framp

Moderator

regexer

jengelh

regexer

framp

Moderator

alana.the.witch

framp

Moderator